1. 首页
  2. 数据库
  3. 其它
  4. 一种基于改进的链式MapReduce的并行ETL应用

一种基于改进的链式MapReduce的并行ETL应用

上传者: 2021-02-24 02:49:42上传 PDF文件 1.49MB 热度 7次
介绍了并行ETL 的相关工作和常见的处理多MapReduce 作业流程的方法;提出一种改进的链式MapReduce 框架,并将此框架应用于一个并行ETL 工具,同时提出一些针对ETL 处理的流程级优化规则,使ETL流程产生更少的MapReduce作业,从而减少I/O以及网络传输的消耗;利用某省份手机上网数据与Hive进行了大数据对比实验,结果表明,本ETL工具的性能平均比Hive快10%~20%。
下载地址
用户评论