1. 首页
  2. 数据库
  3. 其它
  4. python 爬取百度文库并下载(免费文章限定)

python 爬取百度文库并下载(免费文章限定)

上传者: 2021-05-04 00:49:08上传 PDF文件 119.26KB 热度 20次
import requests import re import json import os session = requests.session() def fetch_url(url): return session.get(url).content.decode('gbk') def get_doc_id(url): return re.findall('view/(.*).html', url)[0] def parse_type(content): return re.findall(rdocType.*?\:.*?\'(.*?)\'\,, content)[0] def
下载地址
用户评论