1. 首页
  2. 编程语言
  3. Python
  4. Python爬虫包BeautifulSoup简介与安装(一)

Python爬虫包BeautifulSoup简介与安装(一)

上传者: 2022-01-24 12:11:44上传 PDF文件 83.08 KB 热度 8次

Beautiful Soup的简介简单来说,Beautiful Soup是python的一个库,最主要的功能是从网页抓取数据。Beautiful Soup自动将输入文档转换为Unicode编码,输出文档转换为utf-8编码。你不需要考虑编码方式,除非文档没有指定一个编码方式,这时,Beautiful Soup就不能自动识别编码方式了。Beautiful Soup 3 目前已经停止开发,推荐在现在的项目中使用Beautiful Soup 4,不过它已经被移植到BS4了,也就是说导入时我们需要 import bs4 。所以这里我们用的版本是 Beautiful Soup 4.3.2 。在这里我安装的是 beautifulsoup4 下载完成之后解压运行下面的命令即可完成安装有时候的安装方式会需手动安装 lxml,如果用conda安装会自动把依赖包给安装上。

下载地址
用户评论