1. 首页
  2. 考试认证
  3. 其它
  4. node tarantulaNodeJS网络爬虫工具

node tarantulaNodeJS网络爬虫工具

上传者: 2024-12-09 11:51:16上传 ZIP文件 14.71KB 热度 6次

节狼蛛nodejs crawler/spider,它提供了一个简单的接口来爬取网络。它的API受到了启发。

快速示例:


var brain = { legs: 8, shouldVisit: function(uri) { return true; } };

var tarantula = new Tarantula(brain);

tarantula.on('data', function(uri) { console.info('200', uri); });

tarantula.on('done', function() { console.log('done'); });

tarantula.start([\"http://example.com\"]);

下载地址
用户评论