1. 首页
  2. 数据库
  3. 其它
  4. 论文研究 基于组合词和同义词集的关键词提取算法.pdf

论文研究 基于组合词和同义词集的关键词提取算法.pdf

上传者: 2021-04-17 22:23:55上传 PDF文件 309.58KB 热度 14次
为了提高关键词的提取准确率,在对现有关键词抽取方法进行研究的基础之上,针对影响关键词提取准确率的分词技术、同义词现象等难点,提出了一种基于组合词和同义词集的关键词提取算法。该算法首先利用组合词识别算法极大地改进分词效果,能识别网页上绝大多数的新词、未登录词,为提高关键词自动抽取准确率奠定了坚实的基础;同时利用构造的同义词集,合并同义词的词频,避免了同义词在输出结果中同现;利用综合评分公式,充分考虑候选关键词的位置、长度、词性等特性。实验数据表明,该方法有较高的提取准确率。
下载地址
用户评论