1. 首页
  2. 服务器应用
  3. Proxy
  4. 基于HybridDL模型的文本相似度检测方法

基于HybridDL模型的文本相似度检测方法

上传者: 2020-10-28 02:59:13上传 PDF文件 75.2KB 热度 18次
为了提高文本相似度检测算法的准确度,提出一种结合潜在狄利克雷分布(Latent Dirichlet Allocation,LDA)与Doc2Vec模型的文本相似度检测方法,并把该算法得到的模型命名为HybridDL模型。该算法通过Doc2Vec对文档训练得到文档向量,再利用LDA模型得到文档主题与各个主题下特征词出现的概率,对文档中各主题及特征词计算概率加权和,映射到Doc2Vec文档向量中。实验结果表明,新算法模型比传统的Doc2Vec模型对相似文本的判断更加敏感,在文本相似度检测上具有更高的准确度。
下载地址
用户评论