1. 首页
  2. 编程语言
  3. Java
  4. ( Hadoop2.4.0+Hbase0.94.18+Nutch2.3集中和分布式配置

( Hadoop2.4.0+Hbase0.94.18+Nutch2.3集中和分布式配置

上传者: 2020-05-18 06:10:41上传 DOCX文件 19.58KB 热度 12次
使用github中最新的nutch-2.x源码,Hadoop-2.4.0+Hbase-0.94.18+Nutch-2.3配置攻略,在ubuntu14.04上成功运行本地和分布式爬虫。该文档详细描述了三者版本不兼容问题的解决方案以及各个配置文件的详细配置。
下载地址
用户评论
码姐姐匿名网友 2020-05-18 06:10:41

现在稳定版本为nutch-2.3.1,按照文中的方法,可以跑起来,不过搞了好久。还有为什么,现在回复评价不返分了。还让不让好好玩了。

码姐姐匿名网友 2020-05-18 06:10:41

还可以,正在看, 还没尝试

码姐姐匿名网友 2020-05-18 06:10:41

还可以,正在看,文档中说用的是github上有还没有发布为正式稳定版本的nutch-2.3,2.3现已正式发布了,应该没问题