目前,用于样本选择的逆向置换表压缩算法很多,但需要定量指标来判断算法的优劣。一般来说,评价示例置换表压缩算法会从三个方面考虑索引1的压缩率、压缩速度和解压缩速度
所谓的压缩率是指数据压缩前后大小之间的比例关系。显然,压缩比越高,节省的磁盘空间就越少,同时,从磁盘到倒排表存储器的输入/输出时间也就节省了。
压缩速度是指使用压缩数据所需的时间。与其他两个索引相比,这个索引不如其他两个索引重要,因为压缩是在建立索引的过程中执行的,这是一个后台操作过程,需要对用户查询立即做出响应。即使速度较慢,也没多大关系。另外,索引构建的数量相对较少,所以从个人的角度来看,压缩速度不是一个重要的指标。< br>

解压缩速度在3个索引中非常重要,这意味着将压缩数据再次恢复到原始数据所需的时间因为搜索引擎响应用户查询从磁盘读取压缩数据,并且需要实时解压缩数据以快速响应用户,所以解压缩速度与系统的用户体验密切相关,其重要性不言而喻< br>