xpath提取当当网数学书前十页信息
''' http://category.dangdang.com/cp01.03.51.00.00.00.html get 这些书都在一个个的li标签里,先获取所有的li,再分别对每一个li进行xpath提取,可以避免要提取的字段是空最后数据错位的情况 第二页 http://category.dangdang.com/pg2-cp01.03.51.00.00.00.html 第三页 http://category.dangdang.com/pg3-cp01.03.51.00.00.00.html ''' import requests from lxml import etree # 处理
下载地址
用户评论