网络蜘蛛spider crawl
用Java写的网络蜘蛛,可以抓取网站URL列表,并分词站内外列表。有清晰的注释,和大家一同学习
下载地址
用户评论
不是我想要的,我不想要swing写的框架,我想要个纯java原理的爬虫程序,但总体说写的不错!
形式还不错,有一个源代码文件,有一个可执行文件,还有一个小说明。可是从功能上,只有网址列表,没有内容提取……都不知道要来有什么用……
代码写的很清晰,确实可以爬出相应网络列表,但我需要更具体的网页信息爬取,继续学习。