1. 首页
  2. 数据库
  3. 其它
  4. Hive分区表

Hive分区表

上传者: 2021-01-16 18:41:39上传 PDF文件 326.99KB 热度 29次
一:简介 分区表就是根据指定字段的值进行分类、分组,字段值相同的分为一类然后存储在一个单独的HDFS文件中,多个类就存储在多个文件中。原本存储在一个文件中的数据现在存储在多个文件中,查询数据时只需要知道数据在哪个类别中然后直接去对应类对应的文件中去查询就好,这样只需扫描这一个类别的文件而不需要扫描所有文件,这样提高了查询效率。 分区表就是对文件进行水平分割,对数据分门别类的分开存储。 分区表有两种: 静态分区: 必须手动显式的添加需要分区的字段值, 分类的值有多少个就要添加多少次 (alter table add partition)。静态分区适合分区字段的值比较少的情况。 动态分区:创建表
下载地址
用户评论