1. 首页
  2. 数据库
  3. 其它
  4. 搜狗疫情数据爬取(R语言)

搜狗疫情数据爬取(R语言)

上传者: 2021-01-31 20:53:44上传 PDF文件 611KB 热度 30次
想必大家最近都很关心新冠状肺炎,疫情导致春节被延长,高速被封,大家伙基本都是远程办公。 趁着周末,来写个爬虫,获取搜狗疫情提供的数据,爬取各个省份以及各个市区的确诊、治愈和死亡数据。 1581827981508.png 网页分析 网页地址为:http://sa.sogou.com/new-weball/page/sgs/epidemic?type_page=WEB,在分析网页时,如果在这里使用浏览器的检查功能,根据标签来写xpath,是无法爬取到数据的。如下图,湖北的数据在div.total标签里面,但在源代码中无法搜索到。而且,read_html是获取网页源码,因此如果根据该标签获取数据,
下载地址
用户评论