复合查询
- 1. 复合查询的作用
- 2. 创建将进行操作的表
- 2.1 员工表 emp
- 2.2 部门表 dept
- 2.3 薪资等级表
- 3. 基本查询回顾
- 4. 多表查询
- 4.1 多表查询的定义
- 4.2 笛卡尔积
- 4.3 内连接 inner join
- 4.4 交叉连接 cross join
- 4.5 左外连接 left join
- 4.6 右外连接 right join
- 4.7 自连接
- 5. 子查询
- 5.1 单行子查询
- 5.2 多行子查询
- 5.2.1 in 关键字
- 5.2.2 all 关键字
- 5.2.3 any 关键字
- 5.3 多列子查询
- 5.3.1 多列单行子查询
- 5.3.2 多列多行子查询
- 5.4 from子句中使用子查询
- 6. 临时表
- 7. 合并查询
- 7.1 union 交集
- 7.2 union all 并集
1. 复合查询的作用
复合查询的主要作用包括:
- 数据整合:
通过连接多个表,你可以将分散在不同表中的相关信息整合到一起,形成一个完整的数据集。这对于需要从多个来源获取信息的报告和分析非常有用。 - 提高效率:
相比于多次查询不同的表并将结果手动合并,复合查询可以一次性完成所有操作,减少了与数据库的交互次数,提高了性能。 - 数据关联:
在数据库设计中,通常会使用规范化来减少数据冗余,这意味着相关数据会被存储在不同的表中。复合查询可以帮助你根据表之间的外键关系重新关联这些数据。 - 条件筛选:
复合查询可以让你基于多个表的数据进行复杂的条件筛选。例如,你可以选择满足特定条件的所有记录,即使这些条件涉及多个表中的字段。 - 简化应用逻辑:
在应用程序中,直接使用复合查询可以从数据库层面上处理复杂的逻辑,这样可以简化应用程序代码,并且将业务逻辑更多地放在数据库层面,这有助于维护和优化。
2. 创建将进行操作的表
2.1 员工表 emp
创建表:
CREATE TABLE emp (
empno INT PRIMARY KEY,
ename VARCHAR(10),
job VARCHAR(10),
mgr INT,
hiredate DATE,
sal DECIMAL(7,2),
comm DECIMAL(7,2),
deptno INT
);
插入数据:
INSERT INTO emp (empno, ename, job, mgr, hiredate, sal, comm, deptno) VALUES
(7369, 'SMITH', 'CLERK', 7902, '1980-12-17', 800.00, NULL, 20),
(7499, 'ALLEN', 'SALESMAN', 7698, '1981-02-20', 1600.00, 300.00, 30),
(7521, 'WARD', 'SALESMAN', 7698, '1981-02-22', 1250.00, 500.00, 30),
(7566, 'JONES', 'MANAGER', 7839, '1981-04-02', 2975.00, NULL, 20),
(7654, 'MARTIN', 'SALESMAN', 7698, '1981-09-28', 1250.00, 1400.00, 30),
(7698, 'BLAKE', 'MANAGER', 7839, '1981-05-01', 2850.00, NULL, 30),
(7782, 'CLARK', 'MANAGER', 7839, '1981-06-09', 2450.00, NULL, 10),
(7788, 'SCOTT', 'ANALYST', 7566, '1987-04-19', 3000.00, NULL, 20),
(7839, 'KING', 'PRESIDENT', NULL, '1981-11-17', 5000.00, NULL, 10),
(7844, 'TURNER', 'SALESMAN', 7698, '1981-09-08', 1500.00, 0.00, 30),
(7876, 'ADAMS', 'CLERK', 7788, '1987-05-23', 1100.00, NULL, 20),
(7900, 'JAMES', 'CLERK', 7698, '1981-12-03', 950.00, NULL, 30),
(7902, 'FORD', 'ANALYST', 7566, '1981-12-03', 3000.00, NULL, 20),
(7934, 'MILLER', 'CLERK', 7782, '1982-01-23', 1300.00, NULL, 10);
2.2 部门表 dept
创建表:
CREATE TABLE dept (
deptno INT PRIMARY KEY,
dname VARCHAR(255),
loc VARCHAR(255)
);
插入数据:
INSERT INTO dept (deptno, dname, loc)
VALUES
(10, 'ACCOUNTING', 'NEW YORK'),
(20, 'RESEARCH', 'DALLAS'),
(30, 'SALES', 'CHICAGO'),
(40, 'OPERATIONS', 'BOSTON');
2.3 薪资等级表
创建表:
CREATE TABLE salgrade (
grade TINYINT PRIMARY KEY,
losal SMALLINT,
hisal SMALLINT
);
插入数据:
INSERT INTO salgrade (grade, losal, hisal)
VALUES
(1, 700, 1200),
(2, 1201, 1400),
(3, 1401, 2000),
(4, 2001, 3000),
(5, 3001, 9999);
3. 基本查询回顾
-
查询工资高于500或岗位为MANAGER的雇员,同时还要满足他们的姓名首字母为大写的J
说明:(薪资>500 or job =MANAGR)and 姓名首写为J
命令:select * from emp where (sal>500 or job='MANAGER') and ename like 'J%';
-
按照部门号升序而雇员的工资降序排序
说明:asc–升序;desc–降序
命令:select * from emp order by deptno asc, sal desc;
-
使用年薪进行降序排序
说明:年薪=月薪*12+ifnull(comm,0); comm可能为空值NUll,空值NULL和任何值进行运算都为空置,需要使用ifnull()
函数
命令:
错误示例:select ename, sal*12+ifnull(comm,0) as '年薪' from emp order by '年薪' desc;
同学们可以发现,年薪并没有进行排序,这是为什么呢?
答:在这个查询中,'年薪'
被当作字符串常量来处理,而不是列别名(此时的列别名是年薪
)。因此,这个查询不会按预期的方式工作。正确的写法应该是去掉引号。正确示例:
select ename, sal*12+ifnull(comm,0) as '年薪' from emp order by 年薪 desc;
-
显示工资最高的员工的名字和工作岗位
说明:select max(sal) from emp
只能聚合出最高薪,把此最高薪作为条件。
命令:select ename, job from emp where sal=(select max(sal) from emp)
-
显示工资高于平均工资的员工信息
说明:select avg(sal) from emp
把该查询的结果作为条件
命令:select * from emp where sal>(select avg(sal) from emp);
-
显示每个部门的平均工资和最高工资
说明:先把部门聚合,然后使用聚合函数;最高工资max(),平均工资avg(),使用format()函数格式平均数
命令:select deptno, max(sal) '最高工资', format(avg(sal),2) '最低工资' from emp group by deptno;
-
显示平均工资低于2000的部门号和它的平均工资
说明:having 平均工资 <2000
命令:
错误示例:select deptno, format(avg(sal),2) '平均工资' from emp group by deptno having 平均工资 < 2000;
同学们可以发现,这里的平均工资<2000
并没有起作用,这是为什么呢?
答:因为having
子句用于过滤分组后的结果,format(avg(sal),2)
处理后的结果不再属于分组后的结果,重命名的 ‘平均工资’ 的列不再是分组后的列名,分组后的列名是avg(sal)
。正确示例:
命令:select deptno, format(avg(sal),2) '平均工资' from emp group by deptno having avg(sal) <2000;
命令:
select deptno, avg(sal) '平均工资' from emp group by deptno having 平均工资 <2000;
-
显示每种岗位的雇员总数,平均工资
说明:以 job 聚合
命令:select job,count(*), format(avg(sal),2) from emp group by job;
4. 多表查询
4.1 多表查询的定义
多表查询是指在数据库中从两个或多个表中检索数据的SQL查询。这种查询允许用户基于某些条件将不同表中的数据连接起来,从而获得更复杂和全面的信息。多表查询是关系型数据库管理系统的强大功能之一,它能够帮助用户分析和处理分布在多个表中的数据。
在进行多表查询时,通常会使用到JOIN操作,JOIN可以分为几种类型,包括:
INNER JOIN(内连接):返回两个表中匹配的所有行。只有当两个表中存在匹配的数据时,才会产生结果记录。
LEFT JOIN(左连接):返回左表中的所有记录,以及右表中与之匹配的记录;如果右表没有匹配,则结果中右表的字段为NULL。
RIGHT JOIN(右连接):返回右表中的所有记录,以及左表中与之匹配的记录;如果左表没有匹配,则结果中左表的字段为NULL。
FULL OUTER JOIN(全外连接):返回左表和右表中的所有记录,当某一边没有匹配时,另一边的字段将填充为NULL。
CROSS JOIN(交叉连接):返回左表和右表的笛卡尔积,即左表的每一行与右表的每一行组合。
4.2 笛卡尔积
笛卡尔积(Cartesian Product)是指两个表中所有行的组合。具体来说,如果表 A 有 m
行,表 B 有 n
行,那么它们的笛卡尔积将包含 m×n
行,每行是表 A 中的一行与表 B 中的一行的组合。
定义
在数据库中,笛卡尔积是通过 CROSS JOIN 操作实现的。如果没有指定任何连接条件,结果集将包含所有可能的行组合()。CROSS JOIN 可以显式地使用 CROSS JOIN 关键字,也可以通过逗号, 分隔表名
并在 WHERE 子句中不指定任何连接条件来实现。
示例:
创建表t1:
create table t1(name char(10));
insert into t1 values('李明'), ('李华'), ('李刚');
创建表t2:
create table t2(name char(10));
insert into t2 values('高渐离'), ('王昭君'), ('嫦娥');
查询两个表:
命令:select * from t1 cross join t1;
或 命令:select * from t1, t2;
图解:
4.3 内连接 inner join
定义:返回两个表中匹配的所有行。只有当两个表中存在匹配的数据时,才会产生结果记录。
语法:
SELECT *
FROM table1
INNER JOIN table2
ON table1.column_name = table2.column_name;
ON 子句的主要作用:
- 指定连接条件:
ON 子句用于指定两个表之间的连接条件,这些条件决定了哪些行应该被组合在一起。 - 过滤结果集:
通过 ON 子句,可以有效地过滤掉不符合条件的行,从而减少结果集的大小,提高查询性能。 - 提高查询的可读性和维护性:
使用 ON 子句可以使查询更加清晰和易于理解,特别是对于复杂的多表查询。
将连接条件放在 ON 子句中,而不是放在 WHERE 子句中,可以使查询结构更加明确,便于维护和调试。
示例:
显示雇员名、雇员工资以及所在部门的名字因为上面的数据来自emp和dept表,因此要联合查询
命令:
# 使用 inner join 时可以省略inner,单独使用join
select emp.ename, emp.sal, dept.dname
from emp inner join dept
on emp.deptno = dept.deptno;
图解:
一种简单的写法:
select ename, sal, dname
from emp join dept
on emp.deptno = emp.deptno
4.4 交叉连接 cross join
语法:
SELECT t1.id, t1.name, t2.city
FROM t1
CROSS JOIN t2;
CROSS JOIN 生成的是笛卡尔积,但你可以通过 WHERE 子句来过滤结果集,从而实现类似于 INNER JOIN 的效果。
示例:
显示雇员名、雇员工资以及所在部门的名字因为上面的数据来自emp和dept表,因此要联合查询
命令:
select emp.ename, emp.sal, dept.dname
from emp , dept
where emp.deptno = dept.deptno;
图解:
4.5 左外连接 left join
定义:返回左表中的所有记录,以及右表中与之匹配的记录;如果右表没有匹配,则结果中右表的字段为 NULL。
语法:
SELECT *
FROM table1
LEFT JOIN table2
ON table1.column_name = table2.column_name;
示例:
创建两张表:
-- 建两张表
create table stu (id int, name varchar(30)); -- 学生表
insert into stu values(1,'jack'),(2,'tom'),(3,'kity'),(4,'nono');
create table exam (id int, grade int); -- 成绩表
insert into exam values(1, 56),(2,76),(11, 8);
查询所有学生的成绩,如果这个学生没有成绩,也要将学生的个人信息显示出来
命令:
select * from stu left join exam
on stu.id = exam.id;
由上图图可以看出,左边表的内容去全部显示出来,右边表内进行对左表进行匹配。当左边表和右边表没有匹配时,也会显示左边表的数据,但是,右边表的数据为空。
4.6 右外连接 right join
定义:返回右表中的所有记录,以及左表中与之匹配的记录;如果左表没有匹配,则结果中左表的字段为 NULL。
语法:
SELECT *
FROM table1
RIGHT JOIN table2
ON table1.column_name = table2.column_name;
示例:
创建两张表:
-- 建两张表
create table stu (id int, name varchar(30)); -- 学生表
insert into stu values(1,'jack'),(2,'tom'),(3,'kity'),(4,'nono');
create table exam (id int, grade int); -- 成绩表
insert into exam values(1, 56),(2,76),(11, 8);
查询所有学生的成绩,如果这个学生没有成绩,也要将学生的个人信息显示出来
命令:
select * from exam left join stu
on stu.id = exam.id;
由上图可知,右侧表的内容全部显示出来,左侧的表进行匹配,如果匹配不到数据,则显示空。
4.7 自连接
定义:自连接是指在同一张表连接查询。
语法:
SELECT *
FROM table1 t1 , table1 t2
WHERE t1.column_name = t2.id;
注:自连接的表必须起别名
示例:
显示员工的姓名及上级领导姓名(mgr是员工领导的编号,empno是员工的编号)
领导也是员工,领导和员工都在emp表。
命令:
select t1.ename, t2.ename '领导' from emp t1, emp t2
where t1.mgr = t2.empno;
5. 子查询
子查询是指嵌入在其他sql语句中的select语句,也叫嵌套查询
5.1 单行子查询
定义:返回一行记录的子查询
示例:
-
显示SMITH同一部门的员工
命令:select ename from emp where emp.deptno = (select deptno from emp where ename='SMITH');
-
显示员工FORD的上级领导的编号和姓名(mgr是员工领导的编号;empno是员工编号)
命令:select empno, ename from emp where empno = (select mgr from emp where ename='FORD');
5.2 多行子查询
定义:返回多行记录的子查询
5.2.1 in 关键字
定义:用于检查某个值是否在一个列表中。它可以用在子查询中,也可以直接列出具体的值。
也可以使用 not in。
示例:
查询和10号部门的工作岗位相同的雇员,打印出他们的名字,岗位,工资,部门号,但是不包含10号自
己的
命令:
select ename, job, sal, deptno
from emp
where job in (select job from emp where deptno = 10) and deptno <> 10;
5.2.2 all 关键字
定义:用于比较一个值与子查询返回的所有值。通常与比较运算符(如 =, >, <, >=, <=, <>)一起使用。
有时可以使用 max() 或 min() 聚合函数代替。
示例:
显示工资比部门30的所有员工的工资高的员工的姓名、工资和部门号
-
使用 all 关键字
命令:select ename, sal, deptno from emp where sal > all(select sal from emp where deptno =30);
-
使用 max() 聚合函数
命令:select ename, sal, deptno from emp where sal > (select max(sal) from emp group by deptno haivng deptno =30);
5.2.3 any 关键字
定义:用于比较一个值与子查询返回的任意一个值。通常与比较运算符(如 =, >, <, >=, <=, <>)一起使用。
有时可以使用 max() 或 min() 聚合函数代替。
示例:
显示工资比部门30的任意员工的工资高的员工的姓名、工资和部门号(包含自己部门的员工)
-
使用 any 关键字
命令:select ename, sal, deptno from emp where sal > any(select sal from emp where deptno = 30);
-
使用 min() 聚合函数
命令:select ename,sal, ddptno from emp where sal > (select min(sal) from emp group by deptno having deptno=30);
5.3 多列子查询
5.3.1 多列单行子查询
单行子查询是指子查询只返回单列,单行数据;多行子查询是指返回单列多行数据,都是针对单列而言
的,而多列子查询则是指查询返回多个列数据的子查询语句。
示例:
查询和SMITH的部门和岗位完全相同的所有雇员,不含SMITH本人
命令:
select * from emp
where (deptno,job) = (select deptno, job from emp where ename= 'SMITH') and ename <> 'SMITH';
5.3.2 多列多行子查询
多列多行子查询和多行子查询类似,也是用 in 关键字进行查询。
示例:
查询和SMITH的部门和岗位完全相同的所有雇员,不含SMITH本人
命令:
select * from emp
where (deptno,job) = (select deptno, job from emp where ename= 'SMITH') and ename <> 'SMITH';
5.4 from子句中使用子查询
子查询语句出现在from子句中。这里要用到数据查询的技巧,把一个子查询当做一个临时表使用(章节6讲解临时表)。
示例:
-
显示每个高于自己部门平均工资的员工的姓名、部门、工资、平均工资
命令:select t1.ename, t1.deptno, t1.sal, t2.avgsal from emp t1, (select deptno, avg(sal) avgsal from emp group by deptno) t2 where t1.age > t2.avgsal and t1.deptno=t2.deptno;
-
查找每个部门工资最高的人的姓名、工资、部门、最高工资
命令:select t1.ename, t1.sal, t1.deptno, t2.maxsal from emp t1, (select deptno, max(sal) maxsal from emp group by deptno) t2 where t1.sal = t2.maxsal and t1.deptno= t2.deptno;
-
显示每个部门的信息(部门名,编号,地址)和人员数量
(1)使用多表查询:select t2.dname, t2.deptno,t2.loc, count(*) from emp t1, dept t2 where t1.deptno = t2.deptno group by t2.dname,t2.deptno,t2.loc;
(2)使用子查询
select t1.dname,t1.deptno,t1.loc, t2.count from dept t1, (select deptno, count(*) count from emp group by deptno) t2 where t1.deptno=t2.deptno;
6. 临时表
MySQL一切为表,查询结束、分组结束······后就会生一个临时表。
在某些情况下,MySQL 会使用临时表来存储中间结果。这些情况包括但不限于以下几种:
-
复杂的查询:
当查询涉及多个JOIN、UNION、GROUP BY、ORDER BY 或子查询时,MySQL 可能会创建临时表来存储中间结果。 -
分组和排序:
如果查询包含 GROUP BY 或 ORDER BY 子句,并且结果集较大,MySQL 可能会使用临时表来存储中间结果,以便进行分组或排序操作。 -
子查询:
在某些情况下,特别是当子查询的结果集较大时,MySQL 可能会将子查询的结果存储在临时表中。 -
临时表显式创建:
用户可以显式地创建临时表来存储中间结果,以提高查询性能或简化复杂查询。
MySQL 使用两种类型的临时表:
- 内存临时表(Memory Temporary Table):
- 这种临时表存储在内存中,使用 MEMORY 存储引擎。
- 内存临时表的优点是速度快,但受限于可用内存大小。如果数据量超过内存限制,MySQL 会自动将其转换为磁盘临时表。
- 磁盘临时表(Disk Temporary Table):
- 这种临时表存储在磁盘上,使用 MyISAM 或 InnoDB 存储引擎。
- 磁盘临时表的优点是可以处理更大的数据集,但速度相对较慢。
示例:
显示每个高于自己部门平均工资的员工的姓名、部门、工资、平均工资
命令:
select t1.ename, t1.deptno, t1.sal, t2.avgsal
from emp t1, (select deptno, avg(sal) avgsal from emp group by deptno) t2
where t1.age > t2.avgsal and t1.deptno=t2.deptno;
7. 合并查询
在实际应用中,为了合并多个select的执行结果,可以使用集合操作符 union,union all
7.1 union 交集
该操作符用于取得两个结果集的交集。当使用该操作符时,会自动去掉结果集中的重复行。
示例:
将工资大于2500或职位是MANAGER的人找出来
命令:
select * from emp where sal > 2500 union
select * from emp where job = 'MANAGER';
7.2 union all 并集
该操作符用于取得两个结果集的并集。当使用该操作符时,不会去掉结果集中的重复行。
示例:
工资大于25000或职位是MANAGER的人找出来
命令:
select * from emp where sal >2500 union all
select * from emp where job = 'MANAGER';