测试表字段查询如下:
测试在hive中截取前5位字符的第1种写法:
测试在hive中截取前5位字符的第2种写法:
测试在impala中截取前5位字符的第1种写法:
测试在impala中截取前5位字符的第2种写法:
结果:
1、在hive中,substr函数使用时,首位从0开始和从1开始,用法一致,即
select substr(name,0,5) from bdl_substr_test;
select substr(name,1,5) from bdl_substr_test;
是一致的。
2、在impala中,substr函数使用时,首位从0开始和从1开始,用法不一致,即
select substr(name,0,5) from bdl_substr_test;
select substr(name,1,5) from bdl_substr_test;
是不一致的。
结论:
hive和impala中的substr函数在用法上一定要区分,impala能够执行从0开始但不报错,在实际业务计算中,这将是一个非常大非常大的坑,对结果的影响是非常严重的!!!
impala中使用substr截取前几位字符时一定要从序号1开始,切记!!!