1. 首页
  2. 操作系统
  3. DOS
  4. 基于Lucene的中文分词器的改进与实现

基于Lucene的中文分词器的改进与实现

上传者: 2020-10-27 12:32:28上传 PDF文件 537.86KB 热度 7次
Lucene是一个高效的全文检索工具包,本文主要研究了Lucene的体系架构及其在中文检索上的应用。通过对基于最大匹配算法的中文分词器的设计与改进,并引入文本解析器与构建同义词词库引擎,使得Lucene对中文的检索更加个性化。通过检索结果的对比表明,改进后的中文分词器对检索功能的扩展有了极大的提高。并最终构建出了一个高效的中文全文检索系统。
下载地址
用户评论