一、Hive的DDL语言(数据库、数据表的增删改查操作)
二、Hive的DQL语言(数据库查询语言)
2.1Hive七子句
聚合函数:count()、sum()、max()、min()、avg()可以单独使用。(缩写:cs mm a)
2.1.1 分区查询与分区裁剪
SELECT查询将扫描整个表(所谓的全表扫描)。如果使用PARTITIONED BY子句创建的分区表,则在查询时可以指定分区查询,减少全表扫描,也叫做分区裁剪。
如果select语句没有采用分区裁剪,默认还是使用全表扫描!
所谓分区裁剪
指的是:对分区表进行查询时,会检查WHERE子句或JOIN中的ON子句中是否存在对分区字段的过滤,如果存在,则仅访问查询符合条件的分区,即裁剪掉没必要访问的分区。
2.1.2 group by分组(在where后,where筛选后,group by聚合)
(出现在group by分组的字段必须出现在select中)
( 出现在select中的字段要么出现在group by分组中,要么出现在聚合函数中)
(group by 具有去重功能)
(分组操作必须和聚合函数一起使用)