concat_ws和concat都是用于连接字符串的函数,但它们在使用上有一些区别:
一、concat、concat_ws函数格式:
concat格式: concat(参数1,参数2,…参数n),如果要加’分隔符’直接写在 各参数中间就行
concat_ws格式: concat_ws(分隔符,参数1,参数2,…参数n)
二、两者区别
- 能否拼接INT类型
concat(1, ‘,’, 2) -> 可以
concat_ws(1, ‘,’, 2) -> 不可以
得知,concat是可以执行成功的。由此得出 concat可以直接将 INT类型拼接成STRING,STRING拼接成STRING 更不再话下了;而concat_ws不可以直接拼接INT类型,它要求拼接的类型 必须都得是STRING类型,才能在hive执行。
样例(有需要可以自己写几个测试):
concat(1, ',', 2) -> 1,2 (STRING类型)
concat_ws(1, ',', 2) -> 报错
concat_ws报错:
报错显示concat_ws只支持STRING 或者 array
- 拼接NULL
concat(1, null, 2) -> 结果: null
concat_ws(’,’, ‘1’, null, ‘2’) -> 结果:1,2
得知,concat拼接时,只要参数中有null(有一个null即可),不管有多少不为空的参数,结果都为null;concat_ws遇到参数有null时,则会忽略,不会返回null。
样例(有需要可以自己写几个测试):
concat(1, null, 2) -> null
concat_ws(',', '1', null, '2') -> 1,2
-
分隔符的概念:concat_ws函数允许用户指定一个分隔符(separator),该分隔符将用于在连接字符串时插入到各个字符串之间。这意味着concat_ws函数可以生成带有分隔符的连接结果,而concat函数则没有这个功能,它只是简单地将字符串连接在一起,不考虑任何分隔符。
-
处理NULL值的方式:当concat函数遇到NULL值时,无论其他参数是否为非空,整个结果都将返回NULL。而concat_ws函数在遇到NULL值时则会忽略它,不会因为单个NULL值而导致整个结果返回NULL。这意味着,即使参数中包含NULL,concat_ws也能生成一个有效的连接结果。
-
参数灵活性:concat_ws函数在处理参数时比concat函数更加灵活。concat函数要求所有参数都必须是非空的,否则结果将为NULL。而concat_ws函数则允许参数中包含NULL值,它会在处理时忽略这些NULL值,只连接非NULL的参数。
综上所述,选择使用concat还是concat_ws函数取决于具体的需求:如果需要连接字符串并希望它们之间有分隔符,或者希望在参数中包含NULL值时仍然得到一个有效的结果,那么应该使用concat_ws函数。如果不需要分隔符,且可以接受在参数中有NULL时整个结果变为NULL的情况,那么可以使用concat函数。