MySQL的group by与count(), *字段使用问题

news2025/1/13 19:39:26

文章目录

    • 问题
    • group by到底做了什么
    • 举个例子
    • 简单来说
    • 为什么select字段,count()不能和*共同使用
    • 总结

问题

在这里插入图片描述
这是一段摘抄自MySQL官网的文字。其大致意思是MySQL拓展了group by的使用,MySQL允许选择没有出现在group by中的字段换句话说,标准SQL是不允许select column出现没在group by中出现的字段

所以在MySQL中,select * from table group by column是允许的

在这里插入图片描述

BUT

select *, count(column) from table group by column是不允许的
在这里插入图片描述

我们来简单分析一下原因

group by到底做了什么

  1. 扫描表数据:

    • 数据库引擎从表中读取所有行。
  2. 按分组列进行排序或哈希:

    • 数据库引擎根据 GROUP BY 子句中指定的列对行进行排序,或使用哈希算法将行分到不同的分组中。不同的数据库系统可能使用不同的实现方式(排序、哈希、甚至混合方法)来高效地实现分组。
  3. 分配行到各个分组:

    • 数据库将每一行放入相应的分组。所有具有相同 GROUP BY 列值的行将被分配到同一个分组。
  4. 应用聚合函数:

    • 对每个分组应用指定的聚合函数(如 COUNT, SUM, AVG, MAX, MIN 等)。这些聚合函数会对每个分组中的行进行计算,并返回一个聚合结果。
  5. 生成输出:

    • 对于每个分组,生成一行输出结果,包含 GROUP BY 列以及聚合函数的计算结果。

举个例子

假设我们有一个简单的表 Sales:

CREATE TABLE Sales (
    sale_id INT,
    sale_date DATE,
    amount DECIMAL(10, 2)
);
INSERT INTO Sales (sale_id, sale_date, amount) VALUES
(1, '2023-06-01', 100.00),
(2, '2023-06-01', 150.00),
(3, '2023-06-02', 200.00),
(4, '2023-06-03', 250.00),
(5, '2023-06-03', 300.00);

我们要按 sale_date 分组,并计算每个日期的总销售额:

SELECT sale_date, SUM(amount) AS total_sales
FROM Sales
GROUP BY sale_date;

执行步骤:

  1. 扫描表数据:

    • 数据库读取所有行:(1, ‘2023-06-01’, 100.00), (2, ‘2023-06-01’, 150.00), (3, ‘2023-06-02’, 200.00), (4, ‘2023-06-03’, 250.00), (5, ‘2023-06-03’, 300.00)。
  2. 按分组列进行排序或哈希:

    • 数据库根据 sale_date 对数据进行排序或哈希:[‘2023-06-01’, ‘2023-06-01’, ‘2023-06-02’, ‘2023-06-03’, ‘2023-06-03’]。
  3. 分配行到各个分组:

    • 数据库将行分配到分组:
      • Group 1 (‘2023-06-01’): (1, ‘2023-06-01’, 100.00), (2, ‘2023-06-01’, 150.00)
      • Group 2 (‘2023-06-02’): (3, ‘2023-06-02’, 200.00)
      • Group 3 (‘2023-06-03’): (4, ‘2023-06-03’, 250.00), (5, ‘2023-06-03’, 300.00)
  4. 应用聚合函数:

    • 对每个分组应用 SUM(amount):
    • Group 1: SUM(100.00, 150.00) = 250.00
    • Group 2: SUM(200.00) = 200.00
    • Group 3: SUM(250.00, 300.00) = 550.00
  5. 生成输出:

    • 生成每个分组的输出:
      • (‘2023-06-01’, 250.00)
      • (‘2023-06-02’, 200.00)
      • (‘2023-06-03’, 550.00)

简单来说

说的通俗点就是形成如下数据结构
Map<Column, List> groupBy

  • k1 -> [row1, row2, row3]
  • k2 -> [row4, row5, row6]

然后迭代groupBy,对每个List做聚合处理

ans = []
for key, values in groupBy:
	ans.append(key, 聚合函数(values))

为什么select字段,count()不能和*共同使用

通过上述分析不难发现,count() 函数是对**聚合后的List<Row>**使用

加入我们是select *,那么Row中的数据将会包含一行的所有字段,此时的count应该处理的是count函数 中所指定的字段。count处理完成后,将List<Row>聚合成一个值,那么其他的字段呢?其他的字段也要聚合成一个值,但没有聚合规则呀

所以,count()和*理论上不能同时出现在select字段中。因为count只聚合函数指定的字段,而select *则表示数据行出现所有字段。
其中 一个字段制定了聚合规则,从List聚合为value,那其他字段可不知道怎么聚合,处理后依然是List,因此出现了数据维度的差异,所以理论上count()和*不能同时出现

BUT,我们看看这段SQL
在这里插入图片描述
依然是能够跑通的,但这是为什么呢?

其实原因很简单。虽然其他字段不知道聚合规则,但要从List聚合为value,随便选一条数据不久完事了。我们从上图可知,对于非聚合字段,MySQL选择了组间第一行数据作为输出

总结

理论上,group by [col1, col2…]只能和select [col1, col2…]配合,也就是如果存在group by,那么select的字段必须出现在group by中

但是MySQL做出了拓展,允许非聚合字段和聚合字段同时出现

并且允许select *, count(col1) from table group by col1这种形式的SQL出现

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1810801.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

覆盖路径规划经典算法 The Boustrophedon Cellular Decomposition 论文及代码详解

2000年一篇论文 Coverage of Known Spaces: The Boustrophedon Cellular Decomposition 横空出世&#xff0c;解决了很多计算机和机器人领域的覆盖路径问题&#xff0c;今天我来详细解读这个算法。 The Boustrophedon Cellular Decomposition 算法详解 这篇论文标题为"C…

【Qt】TreeWidget中Item的UserCheckable注意事项,没有出现多选框

1. 异常 开启 ItemIsUserCheckable以后&#xff0c;界面上没有出现多选框。 QTreeWidgetItem *item new QTreeWidgetItem();item->setText(0, "hello");item->setFlags(Qt::ItemIsUserCheckable | Qt::ItemIsSelectable |Qt::ItemIsEnabled | Qt::ItemIsAuto…

最新thinkphp5内核全开源女神赢口红H5公众号版第五版(100%可经营)

最新thinkphp5内核全开源女神赢口红H5公众号版第五版&#xff08;100%可经营&#xff09; 搭建教程 1、程序为thinkPHP5开发 php版本要求5.6&#xff01;不支持虚拟主机&#xff01; 2、上传程序到您的根目录&#xff01;导入m213.sql文件&#xff01;修改数据库配置文件app…

Github 2024-06-10 开源项目日报 Top10

根据Github Trendings的统计,今日(2024-06-10统计)共有10个项目上榜。根据开发语言中项目的数量,汇总情况如下: 开发语言项目数量C项目2Go项目2PHP项目1Blade项目1TypeScript项目1Lua项目1Dart项目1Swift项目1Cuda项目1Python项目1MDX项目1Ventoy: 100%开源的可启动USB解决方…

考虑双碳分时价格的综合能源系统低碳优化调度

目录 一、主要内容介绍&#xff1a; 二、仿真结果&#xff1a; 三、研究内容&#xff1a; 四、代码下载&#xff1a; 一、主要内容介绍&#xff1a; 在含电热气多种能源的综合能源系统中&#xff0c;复杂的能量转换关系以及可再生能源和负荷的波动性&#xff0c;给综合能源…

必备:产品经理工作文档大全

产品经理&#xff08;英文&#xff1a;Product manager&#xff0c;缩写&#xff1a;PM&#xff09;也称产品企划&#xff0c;是指在公司中针对某项或某类的产品进行规划和管理的人员&#xff0c;主要负责产品的研发、制造、营销、渠道等工作。 产品经理是很难定义的一个角色&a…

群体优化算法---水波优化算法介绍以及应用于聚类数据挖掘代码示例

介绍 水波优化算法&#xff08;Water Wave Optimization, WWO&#xff09;是一种新兴的群智能优化算法&#xff0c;灵感来自水波在自然环境中的传播和衰减现象。该算法模拟了水波在水面上传播和碰撞的行为&#xff0c;通过这些行为来寻找问题的最优解。WWO算法由三种主要的操作…

如何发挥物联网电能表的优势

发挥物联网电能表的优势&#xff0c;对于提升电力系统的智能化水平、优化电力资源配置、提高用电效率以及促进环保发展等方面都具有重要意义。 一、实时监测与数据分析 物联网电能表的核心优势在于其能够实时监测电力使用情况&#xff0c;并通过无线网络将数据传输到云平台。…

【数据结构】图论——AOV和AOE(拓扑排序、存放表达式、关键活动、关键路径)

目录 AOV和AOEAOV 有向无环图及其应用(拓扑结构)有向无环图的应用——存放表达式二叉树存放表达式图存放表达式 AOE 有向无环图及其应用——关键路径1. 事件的最早发生时间事件&#xff08;顶点&#xff09;最早发生时间的计算方法&#xff1a; 2. 事件允许的最晚发生时间事件(…

CV每日论文--2024.6.7

1、Convolutional Neural Networks and Vision Transformers for Fashion MNIST Classification: A Literature Review 中文标题&#xff1a;卷积神经网络和视觉变换器在Fashion MNIST分类任务中的应用:文献综述 简介&#xff1a;本文综述了在Fashion MNIST数据集上使用卷积神…

idea鼠标滚轮滚动放大缩小字体

在idea中的【file】->【settings】菜单&#xff0c;弹出settings窗口&#xff0c;点击窗口中的【Editor】->【General】&#xff0c;在右侧窗口中&#xff0c;选中【Change font size with CtrlMouse Wheel in All editors】即可。

mmyolo

cal_map2测试有问题&#xff0c; /home/lsw/miniconda3/envs/mmyolo/lib/python3.8/site-packages/torch/functional.py:445: UserWarning: torch.meshgrid: in an upcoming release, it will be required to pass the indexing argument. (Triggered internally at ../aten/s…

力扣第十题 10.正则表达式匹配

目录 题目 解题思路 正则表达式代码 动态规划代码 官方解题 题目 解题思路 这次也给我捡到狗运了&#xff0c;反正只要一直上传&#xff0c;内存总会遥遥领先的&#xff0c;只要在你速度领先了的情况下。 这次题目还是想当的困难的。我们有两种思路&#xff0c;一种就是使…

Android AOSP定制去掉Google搜索栏

Android AOSP定制去掉Google搜索栏 1.前言&#xff1a; ​ 最近接触了Android系统定制的需求&#xff0c;感觉非常有意思&#xff0c;之前做过Launcher和串口&#xff0c;也自己安装过虚拟机&#xff0c;不过几年没用Linux系统了有点不习惯&#xff0c;Linux命令也不熟悉&…

[Elasticsearch] ES更新问题踩坑记录

drop table if exists tmp.test_create_table; create table if not exists tmp.test_create_table( id int, name string ) stored as parquet; 问题排查 查看ES数据 发现ES创建表的状态没有正常更新 yn 还是0 查看日志 查看日志, 截取部分关键信息: ReceiverControl…

kaggle竞赛实战9——模型融合

有三种方法&#xff0c; 第一种&#xff1a;均值融合&#xff0c;代码如下 data pd.read_csv(\ result/submission_randomforest.csv\ ) data[randomforest] data[target].values temp pd.read_csv(\ result/submission_lightgbm.csv\ ) …

独立游戏之路 -- 看看你是否适合做独立游戏?

独立游戏系列文章介绍 -- 分析你是否适合做独立游戏&#xff1f; 前言一&#xff0c;专栏介绍1.1 订阅须知1.2 关于作者1.3 文章累积 二&#xff0c; 为什么要做独立游戏&#xff1f;2.1 明确目标2.2 几个能力 三&#xff0c;你能独立到什么程度&#xff1f;3.1 设计3.2 美术3.…

IP纯净度对跨境电商有影响吗?

当我们谈论代理IP时&#xff0c;通常会提到一个重要概念&#xff0c;那就是“IP纯净度”。 IP纯净度是指代理IP服务中所提供的IP地址的质量、干净程度和安全性&#xff0c;纯净度高的IP地址通常具备低恶意软件攻击的风险、良好的访问效果、稳定性和速度以及隐私保护等特点。在…

牛客题目线段树

主要是操作三&#xff0c;怎么计算 那么只需要维护区间和和区间平方和即可&#xff0c;1/2用逆元 多个标记注意标记之间有没有影响&#xff0c;mod其实很简单的&#xff0c;但是我标记没处理好一直wa,mod乱搞一下&#xff0c;我mod很丑 #include<iostream> #include<…

根据阿里文档编写【springAI+通义千问】出现的 “Can not find api-key” 异常

昨天晚上照着阿里的文档开始了我的首次【springAI 通义千问】之旅&#xff0c;不料刚开始就被狠狠地搞了一下&#xff0c;主要原因是文档有误导致程序无法按着预期运行。 按着文档一步步配置好以后&#xff0c;启动后报错信息如下&#xff1a; 照着文档&#xff08;如下图&a…