爬虫搜索引擎实例有兴趣的朋友可以研究一哈
关于爬虫技术一、什么是爬虫我这里所说的爬虫就是传统的搜索引擎,因为我们一度把YAHOO一类的目录也称作搜索引擎,所以这个概念已经有些混乱了。搜索引擎:也叫"蜘蛛"或"网络爬虫",为了能产生web页的目录册,搜索引擎持续不停的访问internet上的web站点。由于他们是自动运行,并将大量的web页进行索引,搜索引擎也经常能够发现没有列在目录中的信息。"搜索引擎"这个词一般都用来描述真正的搜索引擎和目录,其实他们并不是一回事,区别在于结果列表是如何编译生成的。二、搜索引擎与目录的区别1)搜索引擎:搜索引擎,如HotBot,自动产生列表。搜索引擎在web上爬行,于是人
下载地址
用户评论
东西挺全的,不错,谢谢楼主
小弟觉得非常不错,还有学习的连接,楼主很有爱~
刚入门,学习了,资料很多
涵盖面很全
不会用呀 有人能教下吗
里面的东西挺全的,不错,谢谢楼主
里面东西是不少,稍微乱了点,但这是我想要的,我正需要JAVA方面的垂直搜索引擎相关的东西,谢谢楼主的资料。
好东西啊,不过代码只有java版本的,我现在想做一个C++的搜索引擎,功能简单点就行,不过看了这些也有很大的帮助,谢谢了