python基础教程:基于Python正则表达式提取搜索结果中的站点地址
@本文来源于公众号:csdn2299,喜欢可以关注公众号 程序员学府 正则表达式对于Python来说并不是独有的,最近在把google搜索的结果中所有的站点地址导出,于是想到用python正则表达式提取搜索结果中的站点地址。 这其中涉及几个需要解决的问题: 1、获取搜索的结果文本 为了获得更多的地址,我使用了Google的高级搜索功能,每个页面显示100条结果。 获得显示的结果后,可以查看源码,并保持成文本文件就有了搜索的结果文本 2、分析如何提取站点信息 首先需要分析获取的页面,查看以怎样的方式可以提取出站点信息。 我使用IE8自带的开发工具(按F12就会弹出来)中的探查器功能查看自己要关心
下载地址
用户评论