1. 首页
  2. 数据库
  3. 其它
  4. Python每日一练(18) 抓取小说目录和全文

Python每日一练(18) 抓取小说目录和全文

上传者: 2020-12-31 04:26:05上传 PDF文件 278.18KB 热度 7次
本文要实现的案例是通过 requests 库抓取 斗破小说网 上指定的小说的目录和每一节的完整内容(只保留纯文本内容)。当抓取包含目录和小说内容的页面后,会通过正则表达式分析 HTML 代码,并提取出目录标题,对应的 url 以及文本形式的小说内容。现在进入斗破小说网,选择一篇小说,本文选择了 斗破苍穹 目录页面如下图所示: 原创文章 39获赞 701访问量 3万+ 关注
下载地址
用户评论