【面试题系列】MySQL 中 GROUP BY 和 DISTINCT 有什么区别？

news2026/3/7 16:25:09

在这里插入图片描述

在 MySQL 中，GROUP BY 和 DISTINCT 是两个常用的 SQL 子句，它们都用于处理数据的重复性，但在使用场景、语法、功能和性能方面存在显著差异。
本文将详细探讨这两者的区别，包括其语法、功能特点、使用场景及性能考虑，并通过丰富的案例来帮助理解。
最后，我们将讨论如何在面试中回答有关这两个概念的问题。

一、基本概念

1. DISTINCT

DISTINCT 关键字用于从查询结果中消除重复的行。它可以应用于一个或多个列，确保返回的每一行都是唯一的。

语法示例：

SELECT DISTINCT column1, column2 FROM table_name;

功能特点：

去重：去除重复数据，以返回唯一的行。
适用范围：可以在 SELECT 语句中使用，适用于简单查询。
返回结果：返回所有列的唯一组合。

2. GROUP BY

GROUP BY 子句用于将查询结果按一个或多个列进行分组。通常与聚合函数（如 COUNT(), SUM(), AVG() 等）一起使用，以便对每个组进行汇总计算。

语法示例：

SELECT column1, COUNT(*) FROM table_name GROUP BY column1;

功能特点：

分组：将数据按指定列分组，适用于统计和汇总。
聚合功能：通常与聚合函数结合使用，可以生成统计信息。
返回结果：每个组的聚合结果，通常包含分组列和聚合计算的结果。

二、主要区别

1. 用途

DISTINCT：用于消除查询结果中的重复行，确保结果集的唯一性。
GROUP BY：用于数据分组和聚合，通常用于统计分析。

2. 返回结果

DISTINCT：返回所有列的唯一值。
GROUP BY：返回每个分组的聚合结果，通常只包含分组列和聚合计算的结果。

3. 行的数量

DISTINCT：结果集的行数取决于所有选择列的组合，可能会返回多行。
GROUP BY：结果集的行数取决于组的数量，通常会少于或等于原始数据集的行数。

4. 语法与功能

DISTINCT 语法简单，适用于基本去重。
GROUP BY 语法稍复杂，通常需要结合聚合函数使用。

三、案例分析

案例 1：使用 DISTINCT

假设我们有一个名为 sales 的表，结构如下：

id	product_name	customer	amount
1	Laptop	John	1200
2	Phone	Jane	800
3	Laptop	John	1200
4	Tablet	Mike	600
5	Phone	Jane	800

我们想查找所有唯一的产品名称：

SELECT DISTINCT product_name FROM sales;

结果：

product_name
Laptop
Phone
Tablet

案例 2：使用 GROUP BY

现在我们想要统计每个产品的销售总额。可以使用 GROUP BY 和 SUM() 函数：

SELECT product_name, SUM(amount) AS total_sales FROM sales GROUP BY product_name;

结果：

product_name	total_sales
Laptop	2400
Phone	1600
Tablet	600

案例 3：结合使用 DISTINCT 和 GROUP BY

假设我们想要计算每位客户购买的唯一产品数量。可以使用 DISTINCT 与 GROUP BY 结合：

SELECT customer, COUNT(DISTINCT product_name) AS unique_product_count FROM sales GROUP BY customer;

结果：

customer	unique_product_count
John	1
Jane	2
Mike	1

案例 4：复杂场景

考虑一个包含订单信息的表 orders，结构如下：

order_id	customer_id	product_id	quantity
1	1	1	2
2	1	2	1
3	2	1	1
4	2	3	3
5	1	1	1

使用 DISTINCT 查找唯一用户：
```
SELECT DISTINCT customer_id FROM orders;
```
结果：

customer_id
1
2

customer_id
1
2

使用 GROUP BY 统计每个用户的总订单数量：

SELECT customer_id, SUM(quantity) AS total_quantity FROM orders GROUP BY customer_id;

结果：

customer_id	total_quantity
1	4
2	4

结合使用 DISTINCT 和 GROUP BY 计算每个用户购买的独特产品数量：
假设还有一个 products 表，包含产品信息。
```
SELECT customer_id, COUNT(DISTINCT product_id) AS unique_products FROM orders GROUP BY customer_id;
```
结果：

customer_id unique_products
1 2
2 2

customer_id	unique_products
1	2
2	2

5. 性能考虑

DISTINCT：在处理大型数据集时，DISTINCT 可能需要全表扫描，从而导致性能下降。
GROUP BY：通常来说，GROUP BY 结合聚合函数使用时更高效，因为数据库可以利用索引和优化器来减少计算量。

在某些情况下，使用 GROUP BY 可能会比使用 DISTINCT 更快，尤其是当数据已经按某列排序时。

四、实用建议

选择合适的工具：在需要简单去重时，使用 DISTINCT；在需要统计和分组时，使用 GROUP BY。
性能优化：在处理大量数据时，考虑使用索引以提高查询性能。
结合使用：在复杂查询中，合理结合 DISTINCT 和 GROUP BY，以满足特定需求。

五、面试回答示例

在面试中，关于 GROUP BY 和 DISTINCT 的问题可以这样回答：

问题示例

面试官: “请解释一下 GROUP BY 和 DISTINCT 的区别，并给出一些使用场景的例子。”

回答示例

“GROUP BY 和 DISTINCT 都用于处理重复数据，但它们的目的和使用场景不同。

DISTINCT 主要用于消除查询结果中的重复行，确保返回的结果集是唯一的。例如，在查询产品名称时，如果有重复的产品名称，我们可以使用 DISTINCT：
```
SELECT DISTINCT product_name FROM sales;
```
GROUP BY 则用于将结果集按指定列分组，通常与聚合函数结合使用。例如，如果我们想要统计每个产品的销售总额，可以使用 GROUP BY：
```
SELECT product_name, SUM(amount) AS total_sales FROM sales GROUP BY product_name;
```