1. 首页
  2. 编程语言
  3. Python
  4. 博文和评论批量获取方法

博文和评论批量获取方法

上传者: 2023-11-24 10:22:30上传 PY文件 13.2KB 热度 55次

执行任务的步骤如下:首先,获取目标博客中的正文内容,并将其存储在一个单独的文件中。其次,收集博文下的评论和回复,分别将它们存储在两个独立的表格中,并确保主码与外码的正确存储,以便后续数据连接。解决方案的第一步是通过爬虫技术从目标网页中解析博文编号。接着,在开发者工具的抓包工具中查看以json格式存储的评论数据,同时查找目标服务器的地址。然后,识别新评论数据包和旧评论数据包之间的联系,确保有效地捕获最新的评论。最后,对每条评论中的回复进行同样的处理,识别新旧回复数据包之间的联系,并按照规则循环爬取。

下载地址
用户评论