一,表结构
表一,test_group 分组表
表二,test_user 用户表
test_group 和 test_user 是一对多的关系
二,sql
- 统计一班的总得分和所有用户的总年龄
SELECT SUM(a.score),SUM(b.age),a.groupname from test_group a LEFT JOIN test_user b on a.id=b.group_id where a.id=1
会发现 一班的 score 不对,翻了4倍。要解释这个问题需要先弄懂 left join。
例如:
1. SELECT * from test_group a LEFT JOIN test_user b on a.id=b.group_id;
2. SELECT * from test_group a LEFT JOIN test_user b on a.id=b.group_id where b.sex=1;
1. SELECT * from test_group a LEFT JOIN test_user b on a.id=b.group_id and b.sex=1;
left join 首先 根据 on 条件组成一个临时表
on 条件可以有多个,on条件是在组成临时表前对 右表的筛选
where 条件是对 组成好的临时表进行筛选,不符合条件的直接筛选掉
语句2中where 条件 sex=1,从临时表中去掉不符合条件的数据
语句3中 on 多个条件,先对右表筛选 sex=1,再生成临时表。左表没有的数据以null补齐,以右表为主。
- sum数据不对的问题
SELECT * from test_group a LEFT JOIN test_user b on a.id=b.group_id where a.id=1;
SELECT SUM(a.score),SUM(b.age),a.groupname from test_group a LEFT JOIN test_user b on a.id=b.group_id where a.id=1;
一对多,实际上是对上面四条数据的 sum(a.score)。
- 正确的写法
SELECT SUM(DISTINCT a.score),SUM(b.age),a.groupname from test_group a LEFT JOIN test_user b on a.id=b.group_id where a.id=1;
因为查询后的每个 group中的score都一样,可以使用 distinct 去重。SUM DISTINCT只能用于单个列的求和,不能用于多个列的求和
SELECT SUM(a.score),SUM(b.age2),a.groupname from test_group a LEFT JOIN (select id,group_id,SUM(age) age2 from test_user GROUP BY group_id) b
on a.id=b.group_id where a.id=1
避免直接lefj join 查询,先查询子表,再将子表查询结果与主表结果关联
先处理“一对多”中这个多表,将多表中的数据先聚合成一条
再和 左表连接查询