1. 首页
  2. 大数据
  3. Hadoop
  4. 山东大学 大数据实验二 倒排索引算法Java实现

山东大学 大数据实验二 倒排索引算法Java实现

上传者: 2020-06-10 13:18:40上传 JAVA文件 5.96KB 热度 15次
山东大学大数据课程的实验二。基于hadoop集群系统(也可以在伪分布式系统上运行)系统使用Java编写的倒排索引实现,具有使用停词表功能,使用正则表达式选择规范的单词。代码重构了setup(),map(),combiner(),partitation()和reducer()函数,功能是对文档进行倒排索引,得到一个单词有序,且单词的文件列表同样有序的倒排列表集合。
下载地址
用户评论