1. 首页
  2. 编程语言
  3. C
  4. 基于多SimHash指纹的近似文本检测

基于多SimHash指纹的近似文本检测

上传者: 2019-09-21 19:30:39上传 KDH文件 346.47KB 热度 27次
SimHash算法是google采用的用来进行页面排重及文本相似度计算的算法,以计算效率高,正确率高而闻名,本文详细介绍了该算法的实现
下载地址
用户评论