1. 首页
  2. 移动开发
  3. 其他
  4. 论文研究 相似索引:适用于重复数据删除的二级索引.pdf

论文研究 相似索引:适用于重复数据删除的二级索引.pdf

上传者: 2020-07-27 05:41:24上传 PDF文件 941.79KB 热度 7次
由于EB(extreme binning)使用文件的最小块签名作为文件的特征, 它不适合处理主要包括小文件的数据负载, 会导致较差的重复数据删除率。为了改进EB, 提出了相似索引。它把相似哈希作为文件的特征, 是一种适用于以小文件为主的数据负载的重复数据删除的二级索引。实验结果表明, 相似索引的重复数据删除率比EB高24. 8%; 相似索引的内存使用量仅仅是EB的0. 265%。与EB相比, 相似索引需要更少的存储使用量和内存使用量。
下载地址
用户评论