Node Puppeteer图像识别实现百度指数爬虫的示例 上传者:朱靖 2020-08-30 02:44:15上传 PDF文件 183.77KB 热度 36次 当鼠标移动到图表上时,会触发两个请求,一个请求返回一段html,一个请求返回一张生成的图片。html中并不包含实际数值,而是通过设置width和margin-left,来显示图片上的对应字符。并且请求参数上带有res、res1这种我们不知如何模拟的参数,所以用常规的模拟请求或者html爬取的方式,都很难爬到百度指数的数据。怎么突破百度这种反爬虫方法呢,其实也很简单,就是完全不去管他是如何反爬虫的。我们只需模拟用户操作,将需要的数值截图下来,做图像识别就行。 下载地址 用户评论 更多下载 下载地址 立即下载 用户评论 发表评论