SQL题目分析:打折日期交叉问题--计算品牌总优惠天数

news2024/11/13 10:07:11

        在电商平台的数据分析中,处理品牌促销活动的日期交叉问题是一个挑战。本文将介绍几种高级SQL技巧,用于准确计算每个品牌的总优惠天数,即使在存在日期交叉的情况下。

问题背景

        我们有一个促销活动表 shop_discount,记录了不同品牌的促销开始日期和结束日期。目标是计算每个品牌的总优惠天数,同时确保同一天内的多个优惠活动只计算一次。

如下为平台商品促销数据:字段为品牌,打折开始日期,打折结束日期
brand stt        edt
oppo,2021-06-05,2021-06-09
oppo,2021-06-11,2021-06-21
vivo,2021-06-05,2021-06-15
vivo,2021-06-09,2021-06-21
redmi,2021-06-05,2021-06-21
redmi,2021-06-09,2021-06-15
redmi,2021-06-17,2021-06-26
huawei,2021-06-05,2021-06-26
huawei,2021-06-09,2021-06-15
huawei,2021-06-17,2021-06-21

计算每个品牌总的打折销售天数,注意其中的交叉日期,比如 vivo 品牌
第一次活动时间为 2021-06-05 到 2021-06-15,第二次活动时间为 2021-06-09 到 2021-06-21 其中 9 号到 15号为重复天数,
只统计一次,即 vivo 总打折天数为 2021-06-05 到 2021-06-21 共计 17 天。

示例数据

1.建表

create table shop_discount(
    brand string,
    stt string,
    edt string
);

2.导入数据

INSERT INTO shop_discount (brand, stt, edt) VALUES
('oppo', '2021-06-05', '2021-06-09'),
('oppo', '2021-06-11', '2021-06-21'),
('vivo', '2021-06-05', '2021-06-15'),
('vivo', '2021-06-09', '2021-06-21'),
('redmi', '2021-06-05', '2021-06-21'),
('redmi', '2021-06-09', '2021-06-15'),
('redmi', '2021-06-17', '2021-06-26'),
('huawei', '2021-06-05', '2021-06-26'),
('huawei', '2021-06-09', '2021-06-15'),
('huawei', '2021-06-17', '2021-06-21');

 3.查询数据是否导入成功

select * from shop_discount;

高级SQL技巧

方法1:使用开窗进行连续区间划分及合并

这种方法通过识别每个品牌的连续促销区间来计算总天数。

SELECT 
    brand,
    SUM(days) AS promotion_day_count
FROM (
    SELECT 
        brand, DATEDIFF(MAX(edt), MIN(stt)) + 1 AS days 
    FROM (
        SELECT 
            brand, stt, edt,
            SUM(is_new_start) OVER (PARTITION BY brand ORDER BY stt) AS interval_id
        FROM (
            SELECT 
                brand, stt, edt,
                IF(stt > COALESCE(LAG_END_DATE, '1970-01-01'), 1, 0) AS is_new_start
            FROM (
                SELECT 
                    brand, stt, edt,
                    MAX(edt) OVER (PARTITION BY brand ORDER BY stt ROWS BETWEEN UNBOUNDED PRECEDING AND 1 PRECEDING) AS LAG_END_DATE
                FROM 
                    shop_discount
            ) t1
        ) t2
    ) t3 
    GROUP BY brand, interval_id
) t4 
GROUP BY brand;

 

方法2:使用开窗求出没有活动的天数

这种方法通过计算每个促销区间之间的空白天数来调整总天数。

SELECT 
    brand,
    DATEDIFF(MAX(edt), MIN(stt)) - SUM(no_promo_days) + 1 AS promotion_day_count
FROM (
    SELECT 
        brand, stt, edt,
        IF(stt > LAG_END_DATE, DATEDIFF(stt, LAG_END_DATE) - 1, 0) AS no_promo_days
    FROM (
        SELECT 
            brand, stt, edt,
            MAX(edt) OVER (PARTITION BY brand ORDER BY stt ROWS BETWEEN UNBOUNDED PRECEDING AND 1 PRECEDING) AS LAG_END_DATE
        FROM 
            shop_discount
    ) t1
) t2 
GROUP BY brand;

 

方法3:使用开窗去除区间之间重复的部分

这种方法通过确保每个促销日期只被计算一次来计算总天数。

SELECT 
    brand, 
    SUM(DATEDIFF(edt, start_date) + 1) AS promotion_day_count
FROM (
    SELECT 
        brand, MAX_END_DATE,
        IF(MAX_END_DATE IS NULL OR stt > MAX_END_DATE, stt, DATE_ADD(MAX_END_DATE, 1)) AS start_date, edt
    FROM (
        SELECT 
            brand, stt, edt,
            MAX(edt) OVER (PARTITION BY brand ORDER BY stt ROWS BETWEEN UNBOUNDED PRECEDING AND 1 PRECEDING) AS MAX_END_DATE
        FROM 
            shop_discount
    ) t1
) t2 
WHERE edt > start_date 
GROUP BY brand;

 

方法4:使用UDTF生成所有活动日期然后去重

这种方法通过生成所有可能的促销日期并去除重复来计算总天数。

SELECT 
    brand,
    COUNT(DISTINCT promo_date) AS promotion_day_count
FROM (
    SELECT 
        brand, DATE_ADD(stt, pos) AS promo_date 
    FROM 
        shop_discount
    LATERAL VIEW 
        POSEXPLODE(SPLIT(REPEAT(',', DATEDIFF(edt, stt)), ',')) tmp AS pos, element
) t1 
GROUP BY 
    brand;

 

结论

        这些高级SQL技巧提供了多种方法来处理促销日期交叉的问题,确保每个品牌的总优惠天数计算准确。选择合适的方法取决于具体的数据结构和性能要求。希望这些技巧能帮助你更好地管理和分析电商平台的促销活动数据。如果你有任何疑问或需要进一步的帮助,请随时联系。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2140588.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

算法:76.最小覆盖子串

题目 链接:leetcode链接 思路分析(滑动窗口) 还是老样子,连续问题,滑动窗口哈希表 令t用的hash表为hash1,s用的hash表为hash2 利用hash表统计窗口内的个字符出现的个数,与hash1进行比较 选…

SpringBoot 消息队列RabbitMQ在代码中声明 交换机 与 队列使用注解创建

创建Fanout交换机 Configuration public class FanoutConfig {Beanpublic FanoutExchange fanoutExchange(){return new FanoutExchange("csdn.fanout");//交换机名称} }创建队列 Beanpublic Queue fanoutQueue3(){return new Queue("csdn.queue");}绑定…

Nature Climate Change | 全球土壤微生物群落调控微生物呼吸对变暖的敏感性(Q10)

本文首发于“生态学者”微信公众号! 全球变暖将加速有机物分解,从而增加土壤中二氧化碳的释放,触发正的碳-气候反馈。这种反馈的大小在很大程度上取决于有机质分解的温度敏感性(Q10)。Q10仍然是围绕土壤碳排放到大气的预测的主要不确定性来源…

软考架构-层次架构风格

一、两层C/S架构 客户端和服务器都有处理功能。处理在表示层(客户端)和数据层(服务器)进行 二、三层C/S架构 将处理功能独立出来。表示层在客户机上,功能层在应用服务器上,数据层在数据库服务器上。 三…

玄机科技浪漫绘情缘:海神缘下,一吻定情

在史莱克学院那片璀璨星空的见证下,《斗罗大陆II绝世唐门》第65集“海神缘相亲大会”的浪漫序幕,温柔地触动了每一位观众的心弦。 本集中,霍雨浩与王冬之间那段跨越重重障碍、终得相守的浪漫告白,在玄机科技独特的审美视角、精细…

强化学习Reinforcement Learning|Q-Learning|SARSA|DQN以及改进算法

一、强化学习RL 强化学习是机器学习的一个重要的分支,是一种有效的工具,在文献中被广泛用于解决MDP问题。在一个强化学习过程中,一个智能体只能通过和它所处的环境互动学习最优策略。特别地,智能体首先观察自己当前的状态&#xf…

JVM 内存模型:堆、栈、方法区讲解

1. 引言 Java 虚拟机(JVM)的内存模型是 Java 程序运行时的基础之一。JVM 内存模型主要包括 堆、栈、和 方法区。它们各自有不同的作用和管理方式,并且影响着程序的性能和稳定性。为了更好地理解 JVM 的内存管理机制,我们将结合电…

数据结构——串的定义及存储结构

串的定义 串(string)——零个或多个任意字符组成的有限序列串是内容受限的线性表 串的几个术语 子串:串中任意几个连续字符组成的子序列称为该串的子串(真子串是指不包含自身的所有子串)主串:包含子串的串…

学习笔记(一)

前言 一、对象 1、由类建模而成,是消息、数据和行为的组合 2、可以接收和发送消息,并利用消息进行彼此的交互。消息要包含传送给对象接收的信息 3、类的实例化:把类转换为对象的过程叫类的实例化。 4、对象的特性 (1) 对象有状态&#…

架构师知识梳理(七):软件工程-工程管理与开发模型

软件工程概述 软件开发生命周期 软件定义时期:包括可行性研究和详细需求分析过程,任务是确定软件开发工程必须完成的总目标,具体可分成问题定义、可行性研究、需求分析等。软件开发时期:就是软件的设计与实现,可分成…

解决VSCode文件的中文GBK和UTF-8编码之间乱码问题

NOTE:近日笔者在使用VSCode编码环境的时候,出现了中文和UTF-8两者之间乱码的问题,特编写本片文章,以作学习记录。 1.需求 用VSCode打开外部的GBK2312编码文件,想在VSCode中统一以UTF-8编码查看(笔者推荐U…

作文网源码 范文论文网模板 带会员系统+支付接口+整站数据

织梦CMS仿某中国作文网源码,文章类网站源码数据采集,采集可能会失效哦,非常漂亮的模板程序。模板divcss设计,符合W3C标准,已做好SEO优化,收录爆增,排名好,模板清爽,漂亮。本站修复了…

Java | Leetcode Java题解之第405题数字转换为十六进制数

题目: 题解: class Solution {public String toHex(int num) {if (num 0) {return "0";}StringBuffer sb new StringBuffer();for (int i 7; i > 0; i --) {int val (num >> (4 * i)) & 0xf;if (sb.length() > 0 || val …

力扣每日一题 公交站间的距离

环形公交路线上有 n 个站,按次序从 0 到 n - 1 进行编号。我们已知每一对相邻公交站之间的距离,distance[i] 表示编号为 i 的车站和编号为 (i 1) % n 的车站之间的距离。 环线上的公交车都可以按顺时针和逆时针的方向行驶。 返回乘客从出发点 start 到目…

五、Kubernetes中的存储

目录 一 configmap 1.1 configmap的功能 1.2 configmap的使用场景 1.3 configmap创建方式 1.3.1 字面值创建 1.3.2 通过文件创建 1.3.3 通过目录创建 1.3.4 通过yaml文件创建 1.3.5 configmap的使用方式 1.3.5.1 使用configmap填充环境变量 1.3.5.2 通过数据卷使用c…

深度学习自编码器 - 引言篇

序言 在深度学习的浩瀚星空中,自编码器( Autoencoder \text{Autoencoder} Autoencoder)以其独特的魅力闪耀着光芒。作为一种无监督学习技术,自编码器通过构建输入数据的压缩表示(编码)及其重构&#xff08…

鸿蒙开发之ArkTS 基础八 联合类型

联合类型 是一个变量可以存储不同的数据类型 形式灵活 使用场景,比如,考试,结果有两种形式,一种是给出具体的多少分,一种是是给出A、B、C、D、这种等级,在之前的变量中,只能存储要么分数&#…

Docker简介在Centos和Ubuntu环境下安装Docker

文章目录 1.Docker简介2.Docker镜像与容器3.安装Docker3.1 Centos环境3.2 Ubuntu环境 1.Docker简介 Docker 是一个开源的应用容器引擎,它允许开发者将应用程序及其依赖项打包到一个可移植的容器中,然后发布到任何流行的 Linux 或 Windows 操作系统上。D…

强制类型转换有哪几种?

目录 1.static_cast 2.dynamic_cast 3.const_cast 4.reinterpret_cast 每种类型转换操作符都有其特定的应用场景和限制,应根据实际需求选择合适的转换方式。特别是 reinterpret_cast,由于它的类型安全性很低,使用时需格外小心。 1.static…

芜湖小孩自闭症寄宿制学校:释放潜能,开启未来

在探索儿童成长的无限可能中,有一群特别的孩子,他们以自己的节奏和方式感知着这个世界,那就是自闭症儿童。自闭症,一个逐渐为社会所熟知的领域,其背后承载着无数家庭的期望与挑战。在广州这座充满温情与活力的城市中&a…