1. 首页
  2. 移动开发
  3. 其他
  4. 论文研究 基于伸缩窗口和等级调整的SNM改进方法.pdf

论文研究 基于伸缩窗口和等级调整的SNM改进方法.pdf

上传者: 2020-07-18 16:43:45上传 PDF文件 1.18MB 热度 17次
对基本邻近排序算法(basic sorted-neighborhood method, SNM)进行分析, 指出其不足, 提出了SNM算法的一种改进方法。采用变步长伸缩窗口, 动态改变检测窗口大小, 避免漏配问题, 并减少不必要的比较。采用动态调整等级法, 根据记录相似度调整字段等级, 并通过等级法将字段等级转换为权重, 解决了人为赋予固定权重主观性强、不准确的问题。通过对实际系统中的数据进行测试, 验证了方法的有效性和优越性。同时, 这两种方法适用于大多数基于排序—合并的相似重复记录检测方法, 提高了相应方法的效率和准确度。
下载地址
用户评论