1. 首页
  2. 编程语言
  3. 其他
  4. 论文研究结合LDA和谱聚类的多文档摘要.pdf

论文研究结合LDA和谱聚类的多文档摘要.pdf

上传者: 2020-06-10 18:33:27上传 PDF文件 536.38KB 热度 20次
自动文摘技术的目标是致力于将冗长的文档内容压缩成较为简短的几段话,将信息全面、简洁地呈现给用户,提高用户获取信息的效率和准确率。所提出的方法在LDA(LatentDirichletAllocation)的基础上,使用Gibbs抽样估计主题在单词上的概率分布和句子在主题上的概率分布,结合LDA参数和谱聚类算法提取多文档摘要。该方法使用线性公式来整合句子权重,提取出字数为400字的多文档摘要。使用ROUGE自动摘要评测工具包对DUC2002数据集评测摘要质量,结果表明,该方法能有效地提高摘要的质量。
下载地址
用户评论