1. 首页
  2. 编程语言
  3. Python
  4. 基于Python的Web信息获取方法研究_魏冬梅

基于Python的Web信息获取方法研究_魏冬梅

上传者: 2021-05-01 10:27:36上传 CAJ文件 131.35KB 热度 13次
随着大数据和云计算等新一代互联网技术的迅速发展 ,W eb 信息量逐日海量递增 。 从海量数据中提取有效 信息 , 挖掘有潜在价值的关系成为当前的研究热点 , 这对揭示已知规律 、 预测未知结果有极大的辅助作用 。 对当前 Web 信息获取方法 、 原理和关键技术进行研究分析 , 重点阐述了数据采集相关技术中网络爬虫算法的分类与应用 。 提出一种以 Python和 相关库为主要工具 , 结合模块化方法 , 构建 Web 文本信息获取系统框架与流程的策略 。 案例中 通过定义采集函数 , 实现对给定的维基百科词条 , 快速搜索与该词条相关信息 , 对词条内链接和外链接进行有效爬 取 。 结果表明 ,P ython在 数据采集方面具有较高的有效性和可扩展性 。
下载地址
用户评论