1. 首页
  2. 编程语言
  3. Python
  4. 观察网新闻爬取

观察网新闻爬取

上传者: 2020-08-20 00:58:43上传 RAR文件 18.19MB 热度 20次
爬取观察网所有新闻,运用python3的多线程,首先正则表达式匹配网址,爬取所有观察网符合要求的新闻,然后处理其中的图片、文字,把标题、新闻内容、发表时间、作者、评论数、阅读数等存入数据库,可用于舆情监督系统的初步探索。
下载地址
用户评论