1. 首页
  2. 编程语言
  3. Python
  4. python爬虫之爬取百度音乐的实现方法

python爬虫之爬取百度音乐的实现方法

上传者: 2022-03-18 13:11:06上传 PDF文件 207.76 KB 热度 21次

如图,笔者此次爬取的是百度音乐的页面,所爬取的类容是上面榜单下的所有内容。但Beaufulsoup不能直接提供这样的方法,但Python无所不能,python里面自带的re模块是我见过最迷人的模块之一。上述代码中,笔者写了两个pattern,因为百度音乐的网页里,li标签有两个结构,当用一个pattern在li中找不到数据时,便使用另一个pattern。相信很多看到这里的小伙伴已经云里雾里,无奈笔者对re板块也知道的不多,对python感兴趣的同学可以查阅相关资料再来看一下代码,相信能够如鱼得水。希望喜欢python的萌新能够快速实现自己的spider,也希望一些大神们能够看到这篇文章时不吝赐教。

下载地址
用户评论