解锁SQL的无限可能 | 且看如何秒解墨天轮SQL挑战赛第二期题目

news2024/9/20 12:16:20

目 录

墨天轮SQL挑战赛第二期

比赛题目

数据准备 

解题过程

方法1: 优雅的解法 |  last_value分析函数忽略NULL值特性实现

方法2: 通用的解法 |  断点分组思想

小结 

 Sql进阶技巧: 如何分析商品入库采购成本数据缺失问题?| 近距离有效的数据缺失值填充问题

 SQL进阶技巧:近距离有效的缺失值填充问题【last_value实现版】

 SQL进阶技巧:埋点日志事件缺失值填充 | 近距离有效的数据缺失值填充问题 

 SQL进阶技巧:按指定排序规则填充数据缺失值 

SQL进阶技巧:近距离有效的数据缺失值填充问题 | 稀疏表补全法 


墨天轮SQL挑战赛第二期

原文链接:解锁SQL的无限可能 | 墨天轮SQL挑战赛第二期,等你来战! - 墨天轮 (modb.pro)

在这个数据驱动的时代,SQL不仅仅是一门语言,更是我们探索和理解数据世界的钥匙。在第一期“SQL挑战赛第一期”中,涌现出了很多优秀、有创意的作品,为了能给大家提供一个展示数据处理技巧、逻辑思维和创造力的平台,墨天轮特举办SQL挑战赛第二期!期待大家在这个过程中,能享受到学习的乐趣和竞争的刺激。

比赛题目

原始数据如图1所示,希望通过一条SQL查出虚拟列AMOUNT_ALL,该列以SEQNO的顺序并根据AMOUNT字段的值填充,如果AMOUNT有值则虚拟列等于该条记录中AMOUNT的值,如果AMOUNT的值为NULL,则该虚拟列为上一条AMOUNT不为NULL的值,输出要求如图所示:

数据准备 

Hive开发环境

create table test_gen as 
(

	select stack(
	     
		    11,
			1  ,     1    ,
	        2  ,     null ,
	        3  ,     null ,
	        4  ,     null ,
	        5  ,     2    ,
	        6  ,     null ,
	        7  ,     null ,
	        8  ,     3    ,
	        9  ,     null  ,
	        10 ,     null  ,
	        11 ,     5     
	
	) as (seqno,amount)

);

解题过程

本题属于近距离有效的数据缺失值填充问题,在我的博客专栏里面,此类问题非常多,现给出如下解法:

方法1: 优雅的解法 |  last_value分析函数忽略NULL值特性实现

利用last_value(a,true) over(order by b)求解,如果该函数第二个参数为true,则按照order by指定的顺序获取距离当前行最近且值不为NULL的一行对应字段值,oracle数据库则使用last_value(a ignore nulls) over(order by b) 语法,另外oracle数据库lag函数的分析函数,也可以忽略null值,实际上对该问题lag函数更为精确,而对于Hive数据库中则lag()函数的分析函数没有忽略NULL值这一特性,只能使用last_value分析函数。

select seqno
     , amount
     , coalesce(amount, last_value(amount, true) over (order by seqno)) amount_all
from test_gen;

方法2: 通用的解法 |  断点分组思想

对于数据库中不支持last_value函数或last_value函数不支持忽略NULL值这一用法的,可以使用该方法,也是比较通用的写法。

select seqno
     , amount
     --取出分组中数据
     , max(amount) over (partition by grp_flg) amount_all
from (select seqno
           , amount
           --找出分组的标记
           , count(amount) over (order by seqno) grp_flg
      from test_gen
      ) t
order by seqno;

小结 

对于本期墨天伦SQL挑战赛的题目不算很难,但是要找出最优雅的解法,对于初中级别的同学则需要一定的积累和沉淀。而对于本期挑战赛的题目,其实在我的CSDN博客专栏:数字化建设通关指南中或SQL进阶实战技巧专栏中,早已将相关的方法进行总结,订购了我的专栏,看过相关文章的同学相信定会秒杀该题目,并得到较好的成绩。其相关技巧及案例的文章整理如下:

 Sql进阶技巧: 如何分析商品入库采购成本数据缺失问题?| 近距离有效的数据缺失值填充问题
 SQL进阶技巧:近距离有效的缺失值填充问题【last_value实现版】
 SQL进阶技巧:埋点日志事件缺失值填充 | 近距离有效的数据缺失值填充问题 
 SQL进阶技巧:按指定排序规则填充数据缺失值 
SQL进阶技巧:近距离有效的数据缺失值填充问题 | 稀疏表补全法 

~~如果想要交流可以关注我的公众号:会飞的一十六 。留言相关问题,作者看到后会回复~~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2070400.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

jvm 调优篇

一 jvm调优篇 1.1 查看新生代和老年代的比例 输入命令: jinfo -flag NewRatio 17480 1.2 查看新生代,survivor和Eden区比例 1.3 查看jvm调优参数 二 调优参数 2.1 oom异常 通过visual vm查看 2.java dump 大对象 2.2 mat工具进行分析 栈的信息

生物信息学数据分析服务

常见个性化分析列表 GEO相关服务 1,芯片数据挖掘。根据芯片类型,计算表达谱,差异基因等 2,高通量测序数据挖掘。根据测序类型,计算表达谱,差异或者peak calling等 3,多组学数据联合分析 4&…

2024年测试岗最新自动化测试面试题整理,干货满满

前言 本文由作者本人根据2024年测试岗最新面试整理所得!内容是很干货的!对我也很有帮助。本文仅做个分享~ 一、接口测试 1、接口测试用例的编写要点有哪些?(问法二:接口测试用例设计需要考虑哪些方面?问法…

AList嵌入动态验证码实现动态校验

前言 晓杰利用ALists创建了个网盘资源站,想着如何增加个动态验证码进行验证后才能进行访问下载,刚开始利用了固定的验证码,用户可以通过JS代码中进行绕过或直接拿到验证码,经过晓杰多次优化,最终版本支持动态获取验证…

大模型之LangChain介绍

1、LangChain介绍 LangChain 就是一个 LLM 编程框架,你想开发一个基于 LLM 应用,需要什么组件它都有,直接使用就行;甚至针对常规的应用流程,它利用链(LangChain中Chain的由来)这个概念已经内置标准化方案了。下面我们…

使用ftl文件导出时,多层嵌套循环

核心点 //针对集合1进行循环 <#list priceDetail as pd>//对集合1中包含的集合2进行存在和判空 判断<#if pd.detail ?exists && pd.detail ?size!0> //对集合2进行循环<#list pd.detail as d>...</#list></#if></#list> 模版…

kafka发送消息-自定义消息发送的拦截器

1、自定义拦截器 创建自定义拦截器类&#xff0c;实现ProducerInterceptor接口。对消息进行拦截&#xff0c;可以在拦截中对消息做些处理&#xff0c;记录日志等操作… package com.power.config;import org.apache.kafka.clients.producer.ProducerInterceptor; import org…

会话技术:Cookie、Session、JWT的优缺点分析与实践

登录认证 会话技术方案一&#xff1a;Cookie方案二&#xff1a;Session方案三&#xff1a;令牌技术JWT令牌介绍生成和校验登录下发令牌案例 会话技术 会话&#xff1a;用户打开浏览器&#xff0c;访问web服务器的资源&#xff0c;会话建立&#xff0c;直到有一方断开连接&…

Java语言程序设计——篇十七(2)

&#x1f33f;&#x1f33f;&#x1f33f;跟随博主脚步&#xff0c;从这里开始→博主主页&#x1f33f;&#x1f33f;&#x1f33f; 欢迎大家&#xff1a;这里是我的学习笔记、总结知识的地方&#xff0c;喜欢的话请三连&#xff0c;有问题可以私信&#x1f333;&#x1f333;&…

vscode tailwind插件无提示

说明 Tailwind CSS IntelliSense插件 版本: v0.12.7 问题: 无代码提示 解决 降版本

string的常用函数

目录 一.string 的 构造函数 二. iterator&#xff08;迭代器&#xff09;&#xff08;类似指针&#xff0c;但不是指针&#xff09; 2.1 begin 和 end 2.2 rbegin 和 rend 三. Capacity 函数 3.1 size 函数 3.2 capacity 函数 3.3 resize 函数 3.4 reserve函数 …

MySQL 相关知识笔记

一、字符编码 MySQL 默认的编码是 utf8&#xff0c;仅支持三个字节的存储&#xff1b;utf8mb4 支持四个字节的存储。 二、数据库操作 查询 查询所有数据库&#xff1a;SHOW DATABASES;查询当前数据库&#xff1a;SELECT DATABASE(); 创建 CREATE DATABASE [IF NOT EXISTS] 数据…

搜维尔科技:Manus Prime 3 Mocap 数据手套VR手套动作捕捉手套

通过在设置中添加手动捕捉功能&#xff0c;轻松创建动画内容。非常适合独立Mocap、预可视化、现场表演流和V-tubing。即插即用符合行业标准具有无与伦比的易用性。 通过添加精确的手部和手指动作捕捉数据&#xff0c;为您的虚拟角色加入情感和个性。Manus Prime 3 Mocap 数据手…

欧拉函数.

欧拉函数 给定 n个正整数 ai&#xff0c;请你求出每个数的欧拉函数。 欧拉函数的定义 输入格式 第一行包含整数 n。 接下来 n行&#xff0c;每行包含一个正整数 ai。 输出格式 输出共 n行&#xff0c;每行输出一个正整数 ai的欧拉函数。 数据范围 1≤n≤100, 1≤ai≤2109 输入…

【逐行注释】MATLAB下的IMM-EKF代码

IMM-EKF 基于EKF的多模型交互。以CV和CT两个模型进行交互&#xff0c;这里对代码进行逐行注释。 注释较多&#xff0c;个人理解的时候如果有误&#xff0c;欢迎指正。 每一行都有注释&#xff1a; 模型概况 二维平面上的运动模型&#xff0c;由CV和CT构成&#xff0c;基于…

【机器学习-监督学习】支持向量机

【作者主页】Francek Chen 【专栏介绍】 ⌈ ⌈ ⌈Python机器学习 ⌋ ⌋ ⌋ 机器学习是一门人工智能的分支学科&#xff0c;通过算法和模型让计算机从数据中学习&#xff0c;进行模型训练和优化&#xff0c;做出预测、分类和决策支持。Python成为机器学习的首选语言&#xff0c;…

Linux:Bash中的命令介绍(简单命令、管道以及命令列表)

相关阅读 Linuxhttps://blog.csdn.net/weixin_45791458/category_12234591.html?spm1001.2014.3001.5482 在Bash中&#xff0c;命令执行的方式可以分为简单命令、管道和命令列表组成。这些结构提供了强大的工具&#xff0c;允许用户组合命令并精确控制其执行方式。以下是对这…

分享一个基于文本挖掘的微博舆情分析系统Python网络舆情监控系统Flask爬虫项目大数据(源码、调试、LW、开题、PPT)

&#x1f495;&#x1f495;作者&#xff1a;计算机源码社 &#x1f495;&#x1f495;个人简介&#xff1a;本人 八年开发经验&#xff0c;擅长Java、Python、PHP、.NET、Node.js、Android、微信小程序、爬虫、大数据、机器学习等&#xff0c;大家有这一块的问题可以一起交流&…

Comsol TPMS_Diamond多孔构型吸声性能仿真

TPMS_Diamond多孔构型是一种新型的吸声材料结构&#xff0c;它采用了三维打印技术制备而成。该构型的设计灵感来自于结晶体的晶格结构&#xff0c;通过将正方形的单元堆积并沿着特定方向旋转&#xff0c;形成了一种类似于钻石的多孔结构。 TPMS_Diamond多孔构型具有以下特点&a…

systemback制作Ubuntu自己的系统镜像

systemback制作Ubuntu自己的系统镜像 目录1.安装、制作2.解决镜像大于4GB的问题3.写入镜像到U盘&#xff14;.安装 目录 systemback制作Ubuntu自己的系统镜像 最近需要备份自己的系统&#xff0c;同时制作安装镜像在另一台笔记本上安装&#xff0c;这里找到了一款很不错的软件…