1. 首页
  2. 课程学习
  3. Java
  4. Kylin分析型数据仓库压缩包

Kylin分析型数据仓库压缩包

上传者: 2023-12-20 14:17:10上传 RAR文件 9.78MB 热度 58次

HDFS是针对通用硬件设计的分布式文件系统,Hadoop的一部分。Hive是基于Hadoop的数据仓库工具,可将结构化数据文件映射为数据库表,提供简易SQL查询功能,转换SQL语句为MapReduce任务运行。其优点在于低学习成本,可快速实现简单MapReduce统计,无需专门开发应用,非常适合数据仓库的统计分析。Spark则是专为大规模数据处理设计的快速通用计算引擎,开源类Hadoop MapReduce的通用并行框架,保留MapReduce优点,但中间输出结果可保存在内存中,减少对HDFS的读写,更适用于需要迭代的算法,但也需注意内存使用量,以免内存溢出。

下载地址
用户评论