【SQL应知应会】分析函数的点点滴滴(一)

news2024/10/6 8:30:31

请添加图片描述

欢迎来到爱书不爱输的程序猿的博客, 本博客致力于知识分享,与更多的人进行学习交流

本文收录于SQL应知应会专栏,本专栏主要用于记录对于数据库的一些学习,有基础也有进阶,有MySQL也有Oracle

请添加图片描述

分析函数的点点滴滴

  • 1.什么是分析函数:
    • 1.1统计分析函数略解
    • 1.2.排序分析函数
      • 1.2.1 ==ROW_NUMBER==
        • MySQL/Oracle的通用方法
        • MySQL方法1:使用分析函数
        • MySQL方法1.1:
        • Oracle方法1:
      • 1.2.2 DENSE_RANK
      • 1.2.3rank 跳跃排序
      • 1.2.4 FIRST和LAST
      • 1.2.5 FIRST_VALUE 和 LAST_VALUE

1.什么是分析函数:

分析函数用于计算基于组的某种聚合值,它和聚合函数的不同之处是对于每个组返回多行,而聚合函数对于每个组只返回一行。

  • 聚合函数会把行数变少,分析函数不会把行数变少

oracle分析函数的语法:

function_name(arg1,arg2,...) 
over 
(<partition-clause> <order-by-clause ><windowing clause>)

partition-clause  数据记录集分组 
order-by-clause   数据记录集排序 
windowing clause  功能非常强大、比较复杂,定义分析函数在操作行的集合。有三种开窗方式: range、row、specifying。

1.1统计分析函数略解

  • COUNT
    功能描述:该函数计算组中表达式的个数。
  • SUM
    功能描述:该函数计算组中表达式的累积和。
  • MIN
    功能描述:在一个组中的数据窗口中查找表达式的最小值。
  • MAX
    功能描述:在一个组中的数据窗口中查找表达式的最大值。
  • AVG
    功能描述:用于计算一个组和数据窗口内表达式的平均值

1.2.排序分析函数

1.2.1 ROW_NUMBER

功能描述:返回有序组中一行的偏移量,从而可用于按特定标准排序的行号。

  • 自行扩展:oracle中rownum与row_number的区别
-- 下例返回每个员工再在每个部门中按员工号排序后的顺序号
  SELECT 
  department_id,   
  first_name||' '||last_name employee_name,  -- 拼接了一个雇员的姓名
  employee_id, 
  ROW_NUMBER() OVER (PARTITION BY department_id ORDER BY employee_id) AS emp_id  -- 根据OVER()里面的内容使用row_number()进行排序
  FROM employees
-- 查找部门内最高薪水的员工信息
mysql:select empno,ename,max(sal) from emp group by empno -- select中的粒度比group by的粒度细,这在 MySQL中可以,但是我这里不行,可能是版本问题
oracle:select empno,(select min(ename) from emp where empno = e.empno) ename,max(sal) from emp e group by empno; -- 括号中的min是当一个empno对应多个ename的时候,如果对应一个ename的时候,可以不写min	 -- 括号里面使用别名是为了区分里面的emp和外面的emp,如果不加别名,默认就是里面的emp 

在这里插入图片描述

MySQL/Oracle的通用方法

select e0.* 
from emp e0,
		 (select deptno,max(sal) sal_max from emp group by deptno) e1,
where e0.deptno = e1.deptno
	and e0.sal = e1.sal_max;  -- 因为求得是部门最高薪水的员工信息,如果没有这个关联,那只是求出了最高薪水

在这里插入图片描述

MySQL方法1:使用分析函数

select * from(
select *,row_number() over (partition by deptno order by sal desc) rn from emp
) a where rn = 1; -- 如果没有外层嵌套的select * from 的话,是不可使用where rn = 1的,要时刻注意执行顺序,rn在select子句中,where的执行顺序比select早
# 而且MySQL还得加一个别名(上面的a),不加报错,Oracle不加不报错

在这里插入图片描述

MySQL方法1.1:

# 如果要求是排名前2的
select * from(
	select * ,
       	   row_number() over ( partition by deptno order by sal desc) rn 
	from emp
) a where rn < 3;  -- 因为是降序排序的,也可以是 rn <= 2 或者between 1 and 2
# ★ not rn > 2 如果使用not进行反选的话,效率是很低的,而且not有时候会让索引失效,部分失效

在这里插入图片描述

# 查看每个部门每个岗位的薪水
select * ,
       row_number() over ( partition by deptno,job order by sal desc) rn 
from emp

在这里插入图片描述

Oracle方法1:

select * from (
 	select e.*,  -- Oracle中如果直接使用*的话,会发生错误,原因未知,所以使用别名
        	row_number() over (partition by deptno order by sal desc) rn 
	from emp e
) a where rn < 3;
-- 把row理解成物理行,上面根据薪水进行排序,但是物理行的行号与薪水的值是没有关系的,会认为sal相同的数据只是不同的行,所以会给一个唯一的行号 

在这里插入图片描述

  • 扩展
select *,
	   row_number () over (partition by deptno order by sal desc) rn
from emp;

在这里插入图片描述

1.2.2 DENSE_RANK

select * from(
 select *,
		dense_rank() over (pritition by deptno order by sal desc)rn
 from emp)a
 where 
 	rn < 2;
  • dense_rank 密集的,稠密的,不间断地
    • 下图中很明显,相同的数据不进行排名(可以用同为100分的两个同学并列第一来理解,99分的同学排名第二)
      在这里插入图片描述

1.2.3rank 跳跃排序

select * from(
select *,
	rank() over (pritition by deptno order by sal desc)rn
from emp)a
where 
	rn < 2;
  • 同为100分的两个同学并列第一来理解,99分的同学排名第三

在这里插入图片描述

1.2.4 FIRST和LAST

  • FIRST

功能描述:从DENSE_RANK返回的集合中取出排在最前面的一个值的行(可能多行,因为值可能相等),因此完整的语法需要在开始处加上一个集合函数以从中取出记录

  • LAST

功能描述:从DENSE_RANK返回的集合中取出排在最后面的一个值的行(可能多行,因为值可能相等),因此完整的语法需要在开始处加上一个集合函数以从中取出记录

select e.*,
	   rank() over (partition by deptno order by sal) rn,
	   MIN(sal) KEEP (dense_rank last order by sal) over (pritition by deptno),
	   MAX(sal) KEEP (dense_rank first order by sal) over (partition by deptno)
	from emp e
  • order by 默认是升序,所以使用last取得是最大值,如果最大值有多个,通过前面的MIN(sal) KEEP来得到一个值

1.2.5 FIRST_VALUE 和 LAST_VALUE

  • FIRST_VALUE:返回组中数据窗口的第一个值。

  • LAST_VALUE:返回组中数据窗口的最后一个值

# oracle:
select e.*,
	   LAST_VALUE(empno) over (partition by deptno order by sal) rn
	from emp e
# mysql:
create table tmp2 
select * from emp order by deptno,sal

select e.*,
	   LAST_VALUE (empno) over (partition by deptno) rn
from tmp2 e

结论:

  • mysql想取到组中按照某个字段排序得最大值或最小值对应得其他信息,得提前将表按照字段排序并物化成临时表,然后再利用分析函last_value和first_value从临时表中进行查询,才能得出正确结果

  • oracle可以直接对源表进行order by,然后用分析函数ast_value和first_value直接查询。 (待验证逻辑: order by 执行顺序最后的,但是这个例子说明orderby在前,分析函数执行在后)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/660941.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

万字详解常用设计模式

本文是博主在工作中对常用设计模式的使用经验总结归纳而来分享给大家。 设计模式一共有23种&#xff0c;本文讲解涉及如下&#xff1a; 责任链模式 模板方法模式 发布订阅模式 策略模式 三大分类 业界一般将设计模式分为三大类&#xff1a; 创建型模式&#xff1a;对类的实…

chatgpt赋能python:Python怎样调字体大小以及优化网站SEO

Python怎样调字体大小以及优化网站SEO 在现代网络时代&#xff0c;网站的排名和SEO越来越受到关注。有一些关键词和技巧可以用来在搜索引擎排名中获得好的位置。其中一个技术是调整字体大小。在本文中&#xff0c;我们将深入探讨如何使用Python调整字体大小&#xff0c;并进一…

chatgpt赋能python:Python如何随机产生多个随机数?

Python如何随机产生多个随机数&#xff1f; Python是一种高级编程语言&#xff0c;它的随机数生成器是其强大的功能之一。在本文中&#xff0c;我们将学习如何使用Python随机数生成器生成多个随机数。 基本概念&#xff1a;随机数生成器 随机数生成器是一种算法或物理设备&a…

【Python】APScheduler定时调度库

文章目录 APScheduler是什么功能特点四大组件触发器[triggers]date 一次性触发器interval 间隔触发器cron 周期触发器 任务存储器[JobStore]MemoryJobStoreMongoDBJobStoreRedisJobStore示例代码 RethinkDBJobStoreSQLAlchemyJobStoreZooKeeperJobStore 执行器[executors]线程池…

chatgpt赋能python:Python如何隐藏进程

Python如何隐藏进程 介绍 进程是指运行中的程序在操作系统中的一个实例。在计算机系统中&#xff0c;进程通常都可以被用户或者其他程序所看到。然而&#xff0c;有时候我们需要隐藏进程&#xff0c;比如保护敏感信息或者防止恶意攻击。 Python是一种高级编程语言&#xff0…

Maven学习笔记(SSM 整合伪分布式案例)

目录 第一节 创建工程&#xff0c;引入依赖 1 创建工程 ①工程清单 ②工程间关系 2、各工程 POM 配置 ①父工程 ②Mybatis 逆向工程 ③环境依赖工程 ④工具类工程 ⑤实体类工程 ⑥组件工程 ⑦Web 工程 第二节 搭建环境&#xff1a;持久化层 1、物理建模 2、Myba…

leetcode算法 -- 数组

1 数组 常见的数组算法有双指针&#xff0c;滑动窗口&#xff0c;二分查找和分冶。 2 双指针 核心的思路&#xff1a;使用两个指针&#xff0c;一个从头开始索引&#xff0c;一个从尾开始索引。 2.1 两数之和ii 167 给你一个下标从 1 开始的整数数组 numbers &#xff0c;该…

chatgpt赋能python:Python怎么随机生成一个数

Python怎么随机生成一个数 在Python编程中&#xff0c;经常有需要随机生成一个整数的需求&#xff0c;比如在游戏中生成随机的道具&#xff0c;或者在数据分析中进行随机采样。 Python中提供了一个内置的random模块&#xff0c;可以方便地实现随机生成一个数。 使用random模…

【Windows】虚拟串口工具VSPD6.9安装

【Windows】虚拟串口工具VSPD6.9安装 1、背景2、安装3、补丁4、验证5、下载 1、背景 参考【Windows】虚拟串口工具VSPD7.2安装。 本博客安装的版本是VSPD6.9&#xff0c;并在文末留下下载链接&#xff0c;以供学习研究。 虚拟串口工具一般用来做上位机软件的串口通信调试&…

Java性能权威指南-总结14

Java性能权威指南-总结14 堆内存最佳实践对象生命周期管理对象重用 堆内存最佳实践 对象生命周期管理 在很大程度上&#xff0c;Java会尽量减轻开发者投入到对象生命周期管理上的精力&#xff1a;开发者在需要的时候创建对象&#xff0c;当不再需要这些对象时&#xff0c;它们…

C++11新特性之右值引用

目录 前文 一&#xff0c;什么是右值引用&#xff1f; 二&#xff0c;左值引用和右值引用比较 三&#xff0c;右值引用的应用场景以及作用 四&#xff0c; 右值引用左值的场景分析 五&#xff0c;完美转发 总结 前文 在C98标准后&#xff0c;C11标准的更新为C注入了新活力&…

chatgpt赋能python:Python如何生成100个随机整数

Python如何生成100个随机整数 在Python中&#xff0c;我们可以使用random库来生成随机整数。在本文中&#xff0c;我们将介绍如何使用Python生成100个随机整数。 什么是随机整数 随机整数是指在一定范围内&#xff0c;产生的整数是随机的且不重复的。这在数据分析、机器学习…

2. CSS的元素显示模式

了解元素的显示模式可以更好的让我们布局页面. 1.什么是元素的显示模式 2.元素显示模式的分类 3.元素显示模式的转换 2.1什么是元素显示模式 作用:网页的标签非常多&#xff0c;在不同地方会用到不同类型的标签&#xff0c;了解他们的特点可以更好的布局我们的网页。 元素显示…

chatgpt赋能python:如何在Python中创建模块:完整指南

如何在Python中创建模块&#xff1a;完整指南 如果你是一位Python开发者&#xff0c;你肯定需要用到模块。模块使得代码更容易组织和管理&#xff0c;并且可以复用许多代码片段&#xff0c; 提高代码的可重用性。在Python中&#xff0c;模块是一组相关函数&#xff0c;方法和变…

[论文笔记]End-to-end Sequence Labeling via Bi-directional LSTM-CNNs-CRF

引言 本文是论文End-to-end Sequence Labeling via Bi-directional LSTM-CNNs-CRF的阅读笔记。 本论文提出了一个受益于单词级(word)和字符级(character)表示的网络架构,通过组合双向LSTM,CNN和CRF。 简介 首先通过CNN编码一个单词的字符级信息到相应的字符表征。然后组合…

【C数据结构】动态顺序表_SeqList

目录 【1】数据结构概述 【1.1】什么是数据结构&#xff1f; 【1.2】数据结构分类 【1.3】数据结构术语 【2】数据结构特点 【2】动态顺序表 【2.1】动态顺序表定义数据结构和接口 【2.1】动态顺序表创建初始化 【2.2】动态顺序表初始化 【2.3】动态顺序表内存释放 【…

【Express.js】处理请求数据

处理请求数据 本节将具体介绍express后端处理请求源携带数据的一些方法和技巧 动态路径 很多时候我们需要处理一些类似但有操作差别或不同对象的业务&#xff0c;我们可以监听一段基本路径&#xff0c;将其中某一个段或者某几段路径作为变量&#xff0c;在接口中根据不同的路…

大学计算机专业实习心得报告13篇

大学计算机专业实习心得报告&#xff08;篇1&#xff09; 通过理论联系实际&#xff0c;巩固所学的知识&#xff0c;提高处理实际问题的能力&#xff0c;为顺利毕业进行做好充分的准备&#xff0c;并为自己能顺利与社会环境接轨做准备。通过这次实习&#xff0c;使我们进一步理…

chatgpt赋能python:如何用Python创建优秀的项目

如何用Python创建优秀的项目 Python是一种功能强大的编程语言&#xff0c;可用于创建各种不同类型的项目。本文将介绍如何使用Python创建优秀的项目&#xff0c;并包括一些有用的技巧和工具。在本文中&#xff0c;我们将着重讨论如何优化我们的Python项目以获得更好的SEO排名。…

Gitlab 服务器搭建

引言 GitLab 是一个用于仓库管理系统的开源项目&#xff0c;使用Git作为代码管理工具&#xff0c;并在此基础上搭建起来的Web服务。安装方法是参考GitLab在GitHub上的Wiki页面。Gitlab是被广泛使用的基于git的开源代码管理平台, 基于Ruby on Rails构建, 主要针对软件开发过程中…