【MySQL】group by在MySQL中使用规则

news2026/4/3 3:58:39

一、group by在MySQL中使用规则

在MySQL中，GROUP BY 子句用于将取自数据库的记录集分组在一起，以便可以对每个组执行聚合函数（如 COUNT(), MAX(), SUM(), AVG() 等）。使用 GROUP BY 时，通常与 SELECT 语句中的聚合函数一起使用，以计算每个组的合计或统计值。

以下是在MySQL中使用 GROUP BY 的一些基本规则：

选择列表中的每个列：在 SELECT 语句中，除了聚合函数外，所有列都必须在 GROUP BY 子句中指定。
等价列：如果 SELECT 列表中的列与 GROUP BY 子句中的列完全相同，那么这些列可以省略在 GROUP BY 子句中。
聚合函数：可以在 SELECT 列表中使用聚合函数，而不需要在 GROUP BY 子句中包含它们。
分组聚合结果：可以使用 GROUP BY 对聚合函数的结果进行分组。
排序：即使使用了 GROUP BY，也可以在 ORDER BY 子句中对结果进行排序。
多列分组：可以在 GROUP BY 子句中使用多个列，以根据多个列的值对结果集进行分组。
分组空值：GROUP BY 子句可以将空值（NULL）视为一个分组。
分组表达式：可以在 GROUP BY 子句中使用表达式，但这些表达式必须与 SELECT 列表中的表达式相同。
分组常量：可以在 GROUP BY 子句中使用常量，但这不是一个好的实践，因为它会导致每个分组只返回一个行。
分组子查询：不能在 GROUP BY 子句中直接使用子查询，但可以在 SELECT 列表中使用子查询。

以下是一个简单的 GROUP BY 使用示例：

SELECT department, AVG(salary) AS average_salary
FROM employees
GROUP BY department;

在这个例子中，我们根据 department 列对员工进行分组，并计算每个部门的平均薪资。

如果你的 SELECT 列表中包含了不在 GROUP BY 子句中的列，MySQL会默认这些列是非聚合列，并且它们在每个组中必须是常数。从MySQL 8.0开始，如果查询包含 GROUP BY 子句，并且 SELECT 列表中包含非聚合列，那么这些非聚合列也必须在 GROUP BY 子句中明确指定。这被称为 “ONLY_FULL_GROUP_BY” SQL模式，它是MySQL 8.0的默认行为。

例如，以下查询在MySQL 8.0或以上版本中会失败，除非启用了 “ONLY_FULL_GROUP_BY” SQL模式：

SELECT department, salary FROM employees GROUP BY department;

要修复这个查询，你需要在 GROUP BY 子句中包含 SELECT 列表中的所有非聚合列：

SELECT department, salary FROM employees GROUP BY department, salary;

或者，你可以使用聚合函数来确保查询有效：

SELECT department, MAX(salary) AS max_salary FROM employees GROUP BY department;

在这个修复后的查询中，我们使用了 MAX() 聚合函数来确保 salary 列在 GROUP BY 子句中得到适当的处理。

二、在使用GROUP BY时，有哪些常见的错误我需要避免？

在使用 GROUP BY 子句时，以下是一些常见的错误和注意事项，你应该避免：

不包含所有非聚合列：
在 SELECT 语句中，如果使用了 GROUP BY，那么所有非聚合列必须在 GROUP BY 子句中指定。例如，如果你在 SELECT 列表中使用了 department 和 salary，那么这两个列都必须包含在 GROUP BY 子句中。
在 GROUP BY 中使用错误的表达式：
如果你在 GROUP BY 子句中使用表达式，确保这些表达式与 SELECT 列表中的表达式完全一致。
忽略 ONLY_FULL_GROUP_BY SQL模式：
在MySQL 8.0及以上版本中，默认启用了 ONLY_FULL_GROUP_BY 模式，这要求 GROUP BY 子句必须包含 SELECT 列表中所有非聚合列。如果你的查询不符合这个要求，将会失败。
在 GROUP BY 中使用子查询：
你不能直接在 GROUP BY 子句中使用子查询。如果你需要这样做，可以考虑将子查询重写为连接（JOIN）或者使用聚合函数。
在 GROUP BY 中使用常量：
虽然可以在 GROUP BY 子句中使用常量，但这通常不是你想要的，因为它会导致每个分组只返回一个行。
对 GROUP BY 的结果进行排序：
如果你想对 GROUP BY 的结果进行排序，确保使用 ORDER BY 子句，并且排序的列要么是 GROUP BY 子句中的列，要么是聚合函数。
使用 GROUP BY 子句中的列进行条件过滤：
在 HAVING 子句中，你可以使用 GROUP BY 子句中的列进行条件过滤，但是不能在 HAVING 子句中使用不在 GROUP BY 中的非聚合列。
混淆 GROUP BY 和 ORDER BY：
GROUP BY 用于逻辑分组，而 ORDER BY 用于物理排序。确保你清楚每个子句的用途，并且正确使用它们。
在 GROUP BY 中使用别名：
不能在 GROUP BY 子句中直接使用 SELECT 列表中列的别名。必须使用原始列名或表达式。
过度使用 GROUP BY：
有时候，你可能不需要 GROUP BY，而是可以使用简单的 WHERE 子句来过滤数据。确保你真正需要分组数据时才使用 GROUP BY。
性能问题：
在大型数据集上使用 GROUP BY 可能会导致性能问题，特别是如果没有适当的索引。确保对用于分组的列进行索引，以优化查询性能。
使用 GROUP BY 与 DISTINCT：
如果你需要对结果进行去重并分组，确保正确使用 DISTINCT 关键字，它应该在 GROUP BY 之前使用。