1. 首页
  2. 大数据
  3. Hive
  4. 数据仓库调研.docx

数据仓库调研.docx

上传者: 2020-01-22 05:51:18上传 DOCX文件 540.99KB 热度 25次
数据仓库,是在数据库已经大量存在的情况下,为了进一步挖掘数据资源、为了决策需要而产生的,它决不是所谓的“大型数据库”。数据仓库(DataWarehouse)是一个面向主题的(SubjectOriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(TimeVariant)的数据集合,用于支持管理决策。数据仓库比较流行的有:AWSRedshift,Greenplum,Hive等(1)面向主题:指数据仓库中的数据是按照一定的主题域进行组织。(2)集成:指对原有分散的数据库数据经过系统加工,整理得到的消除源数据中的不一致性。(3)
下载地址
用户评论