Hive--14---使用sum() over() 实现累积求和

news2025/1/9 17:12:08

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档

文章目录

  • Hive中使用over()实现累积求和
  • 1.总求和
    • ==sum(需要求和的列) over(partition by 分组列 )==
    • 数据准备
    • 需求1
    • 以地区号+网点号+币种 为==唯一键==,求总的金额
    • 需求2
    • 以地区号+网点号+币种 为==唯一键==,
    • state=0的记录金额相加, 反之 金额相减。
    • 求最后总的金额
    • 需求3
    • 以地区号+网点号+币种 为==唯一键==,
    • state=0的记录金额相加, 反之 金额相减。
    • 唯一键相同的最后只出一笔记录 求最后总的金额
  • 2.累积求和
    • ==sum(需要求和的列) over(partition by 分组列 order by 排序列 asc/desc)==
    • 数据介绍
    • 需求1
    • 对每个员工的销售业绩的累积求和
  • 3. 滑动求和
    • ==sum(需要求和的列) over(partition by 分组列 order by 排序列 range between ... and ...)==
    • 数据介绍
    • 需求1
    • 要求每个月对应的最近三个月的业绩之和(包含本月在内)
    • 需求2
    • 更进一步,如果我们想实现不包含本月在内的前三个月的求和,该怎么实现呢?
      • 方法1: 是使用4行的滑动求和减去当前行的结果
      • 方法2: 另一种是==range两边都使用preceding==:


Hive中使用over()实现累积求和

1.总求和

sum(需要求和的列) over(partition by 分组列 )

数据准备

在这里插入图片描述
在这里插入图片描述

需求1

以地区号+网点号+币种 为唯一键,求总的金额

在这里插入图片描述
在这里插入图片描述

需求2

以地区号+网点号+币种 为唯一键

state=0的记录金额相加, 反之 金额相减。

求最后总的金额

在这里插入图片描述
在这里插入图片描述

需求3

以地区号+网点号+币种 为唯一键

state=0的记录金额相加, 反之 金额相减。

唯一键相同的最后只出一笔记录 求最后总的金额

在这里插入图片描述
在这里插入图片描述

2.累积求和

sum(需要求和的列) over(partition by 分组列 order by 排序列 asc/desc)

数据介绍

  • 咱们有三列数据,分别是员工的姓名、月份和销售额:
    在这里插入图片描述

需求1

对每个员工的销售业绩的累积求和

sum(需要求和的列) over(partition by 分组列 order by 排序列 asc/desc)

select
 *,
 sum(cnt) over(partition by name order by month) as total_cnt
from
 default.salerinfo

在这里插入图片描述

3. 滑动求和

sum(需要求和的列) over(partition by 分组列 order by 排序列 range between … and …)

  • 这里需要在over函数中使用range between and指定窗口的大小,向前使用preceding,向后使用following
  • 如2 preceding and 1 following指定的窗口包括当前行、当前行前面两行以及当前行后面一行,总共4行。

数据介绍

  • 咱们有三列数据,分别是员工的姓名、月份和销售额:
    在这里插入图片描述

需求1

要求每个月对应的最近三个月的业绩之和(包含本月在内)

sum(cnt) over(partition by name order by month
 range between 2 preceding and 0 following) 

如果不想写0 following,另一种更为合适的写法是使用current row:

sum(cnt) over(partition by name order by month 
range between 2 preceding and current row)

两种写法都是可以的,结果如下:
在这里插入图片描述
可以看到,在前面的数据不足两行时,有几行就对几行求和。如1月份的滑动求和即本身,2月份的求和结果时1月份和2月份的累积。

需求2

更进一步,如果我们想实现不包含本月在内的前三个月的求和,该怎么实现呢?

方法1: 是使用4行的滑动求和减去当前行的结果

方法2: 另一种是range两边都使用preceding

select
 *,
 sum(cnt) over(partition by name order by month 
 range between 3 preceding and 1 preceding) as total_cnt
from
 default.salerinfo
  • 1 preceding换成 -1 following也可以,二者是等价的
sum(cnt) over(partition by name order by month 
range between 3 preceding and -1 following)

结果如下:
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/181034.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

python图像处理(高斯滤波)

【 声明:版权所有,欢迎转载,请勿用于商业用途。 联系信箱:feixiaoxing @163.com】 在谈高斯滤波之前,我们不妨回顾一下之前谈到的均值滤波和中值滤波。均值滤波,就是对像素点以及周围的8个点计算平均值,然后赋值给新像素点。而中值滤波,则是对像素点及周围的8个…

6. 初识多线程编程

1. 多线程 多线程非常重要,工作中用到的也是非常多,面试时也100%会问多线程。 关于多线程的相关知识,可以参考《计算机操作系统(第四版)》,或者自行百度查看有关文章以及视频都可以,此处不再赘述。 2. python中的多…

常用网址-2023整理

办公&效率人民币大写转换 人民币大写 人民币RMB数字转大写汉字工具我的账单 - 支付宝Bypass - 分流抢票Zen Flowchart - 在线流程图MindMaster - 在线思维导图【抠图】在线抠图软件_AI抠图证件照换底色-稿定设计Visio模板推荐与VisualNet图库转化语音转文字iconfont-阿里巴…

LeetCode动态规划经典题目(九):middle

学习目标: 进一步了解并掌握动态规划 学习内容: 4. LeetCode62. 不同路径https://leetcode.cn/problems/unique-paths/ 5. LeetCode63. 不同路径 IIhttps://leetcode.cn/problems/unique-paths-ii/ 6. LeetCode343. 整数拆分https://leetcode.cn/pro…

人工智能学习06--pytorch06--神经网络骨架nn.Module scipy下载 现有网络模型的使用及修改(VGG16)

神经网络骨架nn.Module 括号里nn.Module表示继承Module类init 初始化 调用父类初始化函数forward scipy下载 pip install scipy -i https://pypi.douban.com/simple/ 现有网络模型的使用及修改(VGG16) pretrained为True时需要下载,在ima…

1. Spring 基础入门

文章目录1. 初识 spring1.1 系统架构1.2 学习路线1.3 核心概念2. IoC 与 DI 入门案例(xml版)2.1 IoC(控制反转)2.2 DI(依赖注入)3. bean 配置3.1 bean 基础配置3.2 bean 别名配置3.3 bean 作用范围配置4. b…

file控件与input标签的属性type=“hidden“标签

<!DOCTYPE html> <html> <head> <meta charset"utf-8"> <title>file控件于与input标签的属性type"hidden"标签</title> </head> <body bgcolor"antiquewhite"> …

k8s中使用Deployment控制器实现升级、回滚、弹性伸缩

前置条件&#xff1a;linux机器已安装k8s集群基于yaml文件创建pod,本次创建pod使用的web.yaml如下apiVersion: apps/v1 kind: Deployment metadata:creationTimestamp: nulllabels:app: webname: web spec:replicas: 2selector:matchLabels:app: webstrategy: {}template:metad…

从零开始的数模(八)TOPSIS模型

一、概念 1.1评价方法概述 1.2概念 TOPSIS &#xff08;Technique for Order Preference by Similarity to an Ideal Solution &#xff09;模型中文叫做“逼近理想解排序方法”&#xff0c;是根据评价对象与理想化目标的接近程度进行排序的方法&#xff0c;是一种距离综合评…

SAP入门技术分享六:搜索帮助

搜索帮助1.概要&#xff08;1&#xff09;利用ABAP数据字典的搜索帮助&#xff08;2&#xff09;利用画面的搜索帮助&#xff08;3&#xff09;Dialog程序中的搜索帮助&#xff08;4&#xff09;报表选择屏幕PARAMETERS的搜索帮助&#xff08;5&#xff09;搜索帮助类型2.创建搜…

plot4gmns:面向通用建模网络范式(GMNS)的快速可视化【v0.1.1】

一款面向通用建模网络范式&#xff08;GMNS&#xff09;的快速可视化工具 目录1. 标准数据框架2. 标准数据框架下的生态2.1 数据解析2.2 数据处理2.3 数据可视化3. 标准数据框架下的可视化3.1 基础语法3.2 进阶语法1. 标准数据框架 制定一套标准的数据框架&#xff0c;可实现不…

python图像处理(中值滤波)

【 声明:版权所有,欢迎转载,请勿用于商业用途。 联系信箱:feixiaoxing @163.com】 中值滤波和均值滤波的区别,有点像中位数收入和平均收入的区别。比如有三个人,年收入分别是10万、1万和1千,那么他们的平均收入就是(10+1+0.1)/3,平均数是3.3万左右,但是中位数…

《真象还原》读书笔记——第二章 编写 MBR 主引导记录

2.1 计算机的启动过程 开机后运行的第一个程序是 BIOS 。 BIOS 搬运 MBR 并 跳转运行 MBR… 2.2 软件接力第一棒 BIOS 全名 基本输入输出系统。 2.2.1 实模式下的 1MB 内存分布 2.2.2 BIOS 是如何苏醒的 BIOS本身不需要修改&#xff0c;于是被写入了ROM中&#xff0c;被映…

更换新电脑,如何将旧电脑数据/文件传输到新电脑?

最好的数据迁移工具提供了一种简单的解决方案&#xff0c;可将您的数据从一台 PC 传输到另一台 PC。 如果您以前没有做过&#xff0c;那么数据迁移的整个过程可能看起来很吓人。无论您是企业用户还是家庭用户&#xff0c;尝试将所有文​​件和文件夹从一台计算机迁移到另一台计…

CCPC2022(桂林)

题目链接&#xff1a;https://codeforces.com/gym/104008 G Group Homework 题目大意&#xff1a;在树上选出两条链&#xff0c;使得在两条链选中的点中&#xff0c;只被一条链选中的点的点权和最大。 题解&#xff1a;显然两条链要么不相交&#xff0c;要么只相交于一个点。…

WhiteHole Base beta版本正式发布!

体验 当前版本为基础测试版本&#xff0c;测试效果可以前往演示视频查看&#xff1a;https://www.bilibili.com/video/BV18Y411D7sA/?spm_id_from333.999.0.0&vd_source641e71dfd1a118fb834c4a5d156688d5 在线体验地址为&#xff1a; http://47.100.239.95 数据将保存~ …

BGP基础实验

1.先配置好IP和环回 [R1]interface GigabitEthernet 0/0/0 [R1-GigabitEthernet0/0/0]ip add 12.1.1.1 24 [R1-GigabitEthernet0/0/0]int l 0 [R1-LoopBack0]ip add 1.1.1.1 24 其他同理 2.在R2&#xff0c;R3&#xff0c;R4上配置OSPF ospf 1 area 0.0.0.0 network 3.3.3.3…

线段树(原理,模板)

文章目录线段树线段树代码(单点修改、区间查询)懒惰标记与区间修改树状数组与区间修改线段树 线段树是用来维护 区间信息 的数据结构 它可以在 O(log⁡n)O(\log n)O(logn) 的时间复杂度内实现单点修改、区间修改、区间查询&#xff08;区间求和&#xff0c;求区间最大值&…

Reasoning Through Memorization: Nearest Neighbor Knowledge Graph Embeddings论文阅读

研究问题 将基于记忆的方法与预训练语言模型相结合&#xff0c;以完成知识图谱补全任务 背景动机 传统模型无法处理未见实体记忆增强神经网络的相关进展&#xff0c;即在传统的计算模块之外添加单独的记忆存储模块 模型方法 首先使用预训练语言模型构建实体的知识库&#…

计算机网络第一章 计算机网络与因特网

1.0 目录[TOC]1.1 什么是Internet&#xff1f;1.1.1 最细微&#xff1a;图&#xff08;Graph&#xff09;Internet由结点Node和边Edge组成结点Node分为主机结点和交换结点边Edge分为接入网链路Access和主干链路Backbone结构图如下&#xff1a;1.1.2 网络的网络&#xff08;Netw…