一种基于文本抽取的网页正文去重算法 上传者:lzs60739 2020-08-19 07:28:01上传 PDF文件 184.47KB 热度 44次 搜索结果页面的去重处理是提高网页检索结果质量的有效途径,笔者结合二叉排序树设计了一种基于文本抽取的网页正文去重 算法,本文给出了该算法的具体实现。实验测试结果表明该算法在判断准确率、时间复杂度方面均具有一定优势,可应用于网络信息检索结果 优化处理中的页面正文内容去重。 下载地址 用户评论 更多下载 下载地址 立即下载 用户评论 发表评论