Pokemon_WebScraping 源码
神奇宝贝网页抓取 该存储库是在“类型学和数据生命周期”主题的背景下创建的,该主题属于加泰罗尼亚开放大学的数据科学硕士。 在其中,使用Python编程语言应用了网络抓取技术,以从网络提取数据,并生成包含NationalPokédex的主要信息的数据集。 该项目由路易斯·马丁·德·帕勃罗( Luis Martin de Pablo)独立完成 性能和要求 主程序是PokemonScraper.py 。 执行时,它将开始Web抓取过程。 它建立在Crawler.py之上, Crawler.py是负责通过http请求下载网络的程序。 请求的库是: 操作系统 CSV 时间 要求 美丽的汤4 输出文件是CSV数据集,以及存储所有.jpg和.png的图像和图标文件夹。 数据集 该数据集汇集了第8代之前存在的893个神奇宝贝的主要特征及其所有形式和变体,总共有1045个条目。 这些数据包括每个神奇
下载地址
用户评论