ETL Project:项目二 源码
ETL项目 ETL项目提案 团队成员: 拉斐尔·塞拉诺(Raphael Serrano) 斯沃巴比卡耶娜 托马斯·梅纳(Thomas Maina) 戴安娜·麦登科(Diana Madonko) 项目概况 我们感兴趣的问题是探索世界各地已出版的书籍和相关信息。 这些数据将能够帮助人们选择书籍,因为它将提供有关评级,可负担性以及其他影响他们选择的领域的更多信息。 摘录-拟议的数据来源 •数据位于何处? 卡格勒 Google图书•数据集格式是什么? CSV JSON•您将如何获取此数据? (例如API,抓取的数据,下载的数据) 原料药 API•我们的数据将提供以下信息:〜ISBN〜书名〜作者〜描述〜语言〜页码〜出版商〜出版年份〜评级〜国家〜零售价格〜货币代码〜打印类型 转换-建议的清理和分析•您将对数据进行哪些转换? (例如,过滤,聚合,派生列)过滤和派生列•您将采取什么步骤来
下载地址
用户评论