Compare different searching algorithms Information Retrieval
比较不同搜索算法---信息检索。我们将测试以下算法:
-
向量空间模型
-
BM25
-
带狄利克雷平滑的语言模型
-
使用Jelinek Mercer平滑的语言模型(λ=0.7)
这些算法的性能将与TREC主题进行比较。每个主题下有两种类型的查询:
-
短查询(title字段)
-
长查询(description字段)
对于每种搜索方法,需要生成两个结果文件。例如:
- 对于BM25,生成文件BM25longQuery.txt和BM25shortQuery.txt。
下载地址
用户评论