sparkify_postgres_data_modeling:虚幻音乐流启动创业公司Sparkify的PostgreSQL数据库模型和ETL管道 源码
:eye_in_speech_bubble: 项目概况 由于虚构的音乐流媒体启动公司Sparkify的执行套件不断听到“数据是21世纪的精华”,因此他们决定收集可以获取的有关所提供歌曲和用户收听活动的所有数据。 但是,这些数据是从单个JSON文件的收集的,该初创公司很快意识到其数据分析师和科学家很难以这种方式利用数据。 因此,高管们决定聘请数据工程师加入团队,以使数据可以在关系PostgreSQL数据库中使用。 该项目是。 :goal_net: 分析目标 分析团队有兴趣了解用户正在收听哪些歌曲以及何时收听。 主要原因是: 知道收听特定歌手的歌曲的频率是一个重要指标,可以相应地向歌手支付歌曲许可费。 知道在一天中或一周中的任何给定时间有多少用户正在使用他们的服务,Sparkify可以计划对用户的影响最小的服务器维护。 Sparkify可以分析用户正在收听的歌曲,以个性化为其每个用户的新曲目推荐。 :glowing_star: 数据库架构 Postgre
下载地址
用户评论