每天30分钟 一起来学习爬虫——day10(解析数据 之 xpath实例:好段子爬取)
文章目录xpath 解析网页什么是xpath ?常用的路径表达式:实例:安装xpath插件到浏览器。看代码中的使用:爬取好段子 xpath 解析网页 什么是xpath ? xml: 可扩展标记语言,用来传输和存储数据。他的标签没有预定义,要自己定义标签。 与html的区别: html是用来显示数据的,html的标签是固定的 xpath: 是一门在xml 文档中查找信息的语言,这里,我们可以用xpath来查找html文档,它是一种路径表达式 常用的路径表达式: 表达式 含义 // 不考考虑位置的查找 ./ 从当前节点开始往下查找 . . 从当前节点的父节点往下找
下载地址
用户评论