1. 首页
  2. 数据库
  3. 其它
  4. 详解BeautifulSoup获取特定标签下内容的方法

详解BeautifulSoup获取特定标签下内容的方法

上传者: 2021-02-25 18:37:44上传 PDF文件 61.43KB 热度 20次
以下是个人在学习beautifulSoup过程中的一些总结,目前我在使用爬虫数据时使用的方法的是:先用find_all()找出需要内容所在的标签,如果所需内容一个find_all()不能满足,那就用两个或者多个。接下来遍历find_all的结果,用get_txt()、get(‘href’)、得到文本或者链接,然后放入各自的列表中。这样做有一个缺点就是txt的数据是一个单独的列表,链接的数据也是一个单独的列表,一方面不能体现这些数据之间的结构性,另一方面当想要获得更多的内容时,就要创建更多的空列表。 遍历所有标签: soup.find_all('a') 找出所有页面中含有标签a的html语句
下载地址
用户评论