文章目录
- 一.数据类型
- 1. 基础数据类型
- 2. 复杂数据类型
- 二. 显式转换与隐式转换
- 三. hive的读时模式
一.数据类型
1. 基础数据类型
2. 复杂数据类型
- array: 有序相同数据类型的集合。 arrays(1, 2)
- map : key必须是基本数据类型,value不限。 map(‘a’, 1, ‘b’, 2)
- struct : 不同类型字段的集合。类似于 C语言的结构体。通过”点”得到所需要的元素,比如user是一个STRUCT类型,那么可以通过user.address得到这个用户的地址。
- union : 不同类型的元素存储在同一字段的不同行中。create_union(1, ‘a’, 63)
这里创建一个包含复杂类型的表:
CREATE TABLE employees (
name STRING,
salary FLOAT,
subordinates ARRAY<STRING>,
deductions MAP<STRING, FLOAT>,
address STRUCT<street:STRING, city:STRING, state:STRING, zip:INT>
) PARTITIONED BY (country STRING, state STRING);
二. 显式转换与隐式转换
Hive 中基本数据类型遵循以下层次结构, 按照这个层次结构, 子类型到祖先类型允许隐式转换。
//String 转float、int 转float
hive> select '1.0'+2;
3.0
//String 转int
hive> select '1111' > 10;
//int 转float
hive> select 1 > 0.8;
同时也可以使用 cast 函数进行强制类型转换;
hive> select cast('1111s' as int);
NULL //强制类型转换失败, 返回 NULL
hive> select cast('1111' as int);
1111
三. hive的读时模式
Hive 中数据加载过程采用 “读时模式” (schema on read), 加载数据时不进行数据格式的校验, 读取数据时如果不合法则显示NULL。
这种模式的优点是加载数据迅速。 读时模式 -> 读时检查数据 -> Hive;
参考:
https://www.iteblog.com/archives/870.html