思路分析:
(1)计算表中每一条数据所对应的活动天数days
(2)使用posexplode函数对days炸裂求其索引值index
(3)使用开始日期+index补全后面每一个活动日期in_date
(4)按品牌对in_date做去重计数就可以求得品牌的活动天数了
**注:
该问题的核心点有两个(1)split(space(days), ‘’)函数按照数字构建空字符串再将其切分重构为一个数组;
(2)lateral view posexplode(split(space(days), ‘’)) tmp as index,value
函数,将数组拆分为多行且每一行都保留有它的索引值,它的返回值一个是索引一个是真实的值,需要用索引值来辅助做日期补全。
select length(space(2));>2
select size(split(space(2), ‘’));>3
SELECT posexplode(split(space(2), ‘’));==>0 1 2,结果从0开始且会比原始值多1
**
代码实现:
SELECT
brand,
count(distinct in_date) promotion_day_count
from(
select
brand,
-- 开始日期+位置计算出活动每一天日期
date_add(start_date, index) in_date
from(
SELECT
brand,
start_date,
end_date,
--天数
datediff(end_date, start_date) as days
from promotion_info
) t1 lateral view posexplode(split(space(days), '')) tmp as index
,value
) t2
group by brand;