1. 首页
  2. 移动开发
  3. 其他
  4. 学习使用语义资源完善生物医学信息检索的扩展术语

学习使用语义资源完善生物医学信息检索的扩展术语

上传者: 2021-04-07 08:19:13上传 PDF文件 2.3MB 热度 6次
学习排名利用机器学习方法通​​过监督构建排名模型来解决排名问题,该排名模型需要将文档的固定长度特征向量作为输入,并输出通过迭代减少预定义排名损失而学习到的排名模型。 始终根据经典的文本统计信息来提取文档特征,并且不同的特征对排名性能的贡献也不同。 鉴于定义良好的特征将对检索性能做出更大的贡献,因此我们研究了使用自动编码器来丰富文档的特征表示。 自动编码器作为深度神经网络的基本构建模块,已成功用于许多文本挖掘任务中以生成有效特征。 为了丰富学习排名的功能空间,我们在自动编码器的损失函数中引入了监督功能。 具体来说,我们首先在训练数据上训练线性排名模型,然后将学习到的权重合并到自动编码器的重建成本中。 同时,我们会针对给定查询的查询成本进行累积,以产生更多有用的功能。 我们在三个LETOR数据集上评估了模型的有效性,并表明我们的模型可以生成有效的文档特征以提高检索性能。
下载地址
用户评论