一、多表查询
①:多表关系
项目开发中,在进行数据库表结构设计时,会根据业务需求及业务模块之间的关系,分析并设计表结
构,由于业务之间相互关联,所以各个表结构之间也存在着各种联系,基本上分为三种:
- 一对多(多对一)
- 多对多
- 一对一
1. 一对多
- 案例: 部门 与 员工的关系
- 关系: 一个部门对应多个员工,一个员工对应一个部门
- 实现: 在多的一方建立外键,指向一的一方的主键
2. 多对多
- 案例: 学生 与 课程的关系
- 关系: 一个学生可以选修多门课程,一门课程也可以供多个学生选择
- 实现: 建立第三张中间表,中间表至少包含两个外键,分别关联两方主键
3.一对一
- 案例: 用户 与 用户详情的关系
- 关系: 一对一关系,多用于单表拆分,将一张表的基础字段放在一张表中,其他详情字段放在另一张表中,以提升操作效率
- 实现: 在任意一方加入外键,关联另外一方的主键,并且设置外键为唯一的(UNIQUE)
②:多表查询概述
1. 数据准备
-
删除之前 emp, dept表的测试数据
-
执行如下脚本,创建emp表与dept表并插入测试数据
-- 创建部门表
create table dept(
id int auto_increment comment 'ID' primary key,
name varchar(50) not null comment '部门名称'
) comment '部门表';
-- 创建员工表
create table emp(
id int auto_increment comment 'ID' primary key,
name varchar(50) not null comment '姓名',
age int comment '年龄',
job varchar(20) comment '职位',
salary int comment '薪资',
entrydate date comment '入职时间',
managerid int comment '直属领导ID',
dept_id int comment '部门ID'
) comment '员工表';
-- 添加外键
alter table emp
add constraint fk_emp_dept_id foreign key (dept_id) references dept (id);
-- 添加部门信息
INSERT INTO dept (id, name)
VALUES (1, '研发部'),
(2, '市场部'),
(3, '财务部'),
(4, '销售部'),
(5, '总经办'),
(6, '人事部');
-- 添加员工信息
INSERT INTO emp (id, name, age, job, salary, entrydate, managerid, dept_id)
VALUES (1, '金庸', 66, '总裁', 20000, '2000-01-01', null, 5),
(2, '张无忌', 20, '项目经理', 12500, '2005-12-05', 1, 1),
(3, '杨逍', 33, '开发', 8400, '2000-11-03', 2, 1),
(4, '韦一笑', 48, '开发', 11000, '2002-02-05', 2, 1),
(5, '常遇春', 43, '开发', 10500, '2004-09-07', 3, 1),
(6, '小昭', 19, '程序员鼓励师', 6600, '2004-10-12', 2, 1),
(7, '灭绝', 60, '财务总监', 8500, '2002-09-12', 1, 3),
(8, '周芷若', 19, '会计', 48000, '2006-06-02', 7, 3),
(9, '丁敏君', 23, '出纳', 5250, '2009-05-13', 7, 3),
(10, '赵敏', 20, '市场部总监', 12500, '2004-10-12', 1, 2),
(11, '鹿杖客', 56, '职员', 3750, '2006-10-03', 10, 2),
(12, '鹤笔翁', 19, '职员', 3750, '2007-05-09', 10, 2),
(13, '方东白', 19, '职员', 5500, '2009-02-12', 10, 2),
(14, '张三丰', 88, '销售总监', 14000, '2004-10-12', 1, 4),
(15, '俞莲舟', 38, '销售', 4600, '2004-10-12', 14, 4),
(16, '宋远桥', 40, '销售', 4600, '2004-10-12', 14, 4),
(17, '陈友谅', 42, null, 2000, '2011-10-12', 1, null);
dept表共6条记录,emp表共17条记录。
2. 概述
原来查询单表数据,执行的SQL形式为:select * from emp;
那么我们要执行多表查询,就只需要使用逗号分隔多张表即可,如: select * from emp , dept;
具体的执行结果如下:
此时,我们看到查询结果中包含了大量的结果集,总共102条记录,而这其实就是员工表emp所有的记录
(17) 与 部门表dept所有记录(6) 的所有组合情况,这种现象称之为笛卡尔积。接下来,就来简单
介绍下笛卡尔积。
笛卡尔积: 笛卡尔乘积是指在数学中,两个集合A集合 和 B集合的所有组合情况。
而在多表查询中,我们是需要消除无效的笛卡尔积的,只保留两张表关联部分的数据
我们可以给多表查询加上连接查询的条件即可。
select * from dept, emp where dept_id = dept.id;
而由于id为17的员工,没有dept_id字段值,所以在多表查询时,根据连接查询的条件并没有查询
到。
3. 分类
- 连接查询
- 内连接:相当于查询A、B交集部分数据
- 外连接:
- 左外连接:查询左表所有数据,以及两张表交集部分数据
- 右外连接:查询右表所有数据,以及两张表交集部分数据
- 自连接:当前表与自身的连接查询,自连接必须使用表别名
- 子查询
③:内连接
1. 语法
内连接查询的是两张表交集部分的数据。(也就是绿色部分的数据)
内连接的语法分为两种: 隐式内连接、显式内连接。先来学习一下具体的语法结构
- 隐式内连接
SELECT 字段列表 FROM 表1 , 表2 WHERE 条件 ... ;
- 显式内连接
SELECT 字段列表 FROM 表1 [ INNER ] JOIN 表2 ON 连接条件 ... ;
2. 案例
1.查询每一个员工的姓名 , 及关联的部门的名称 (隐式内连接实现)
表结构: emp , dept
连接条件: emp.dept_id = dept.id
select emp.name, dept.name from dept, emp where dept_id = dept.id;
-- 为每一张表起别名,简化SQL编写
select e.name, d.name from dept d, emp e where dept_id = d.id;
2.查询每一个员工的姓名 , 及关联的部门的名称 (显式内连接实现) — INNER JOIN …ON …
表结构: emp , dept
连接条件: emp.dept_id = dept.id
select e.name, d.name from emp e join dept d on e.dept_id = d.id;
-
表的别名:
- ①. tablea as 别名1 , tableb as 别名2 ;
- ②. tablea 别名1 , tableb 别名2 ;
-
注意事项:
- 一旦为表起了别名,就不能再使用表名来指定对应的字段了,此时只能够使用别名来指定字段。
④:外连接
1. 语法
外连接分为两种,分别是:左外连接 和 右外连接。具体的语法结构为:
- 左外连接
SELECT 字段列表 FROM 表1 LEFT [ OUTER ] JOIN 表2 ON 条件 ... ;
左外连接相当于查询表1(左表)的所有数据,当然也包含表1和表2交集部分的数据。
- 右外连接
SELECT 字段列表 FROM 表1 RIGHT [ OUTER ] JOIN 表2 ON 条件 ... ;
右外连接相当于查询表2(右表)的所有数据,当然也包含表1和表2交集部分的数据。
2. 案例
1. 查询emp表的所有数据, 和对应的部门信息由于需求中提到,要查询emp的所有数据,所以是不能内连接查询的,需要考虑使用外连接查询。
表结构: emp, dept
连接条件: emp.dept_id = dept.id
select e.*, d.name from emp e left join dept d on e.dept_id = d.id;
2. 查询dept表的所有数据, 和对应的员工信息(右外连接) 由于需求中提到,要查询dept表的所有数据,所以是不能内连接查询的,需要考虑使用外连接查询。
表结构: emp, dept
连接条件: emp.dept_id = dept.id
select d.*, e.* from emp e right join dept d on e.dept_id = d.id;
-
注意事项:
- 左外连接和右外连接是可以相互替换的,只需要调整在连接查询时SQL中,表结构的先后顺
序就可以了。而我们在日常开发使用时,更偏向于左外连接。
- 左外连接和右外连接是可以相互替换的,只需要调整在连接查询时SQL中,表结构的先后顺
⑤:自连接
1. 自连接查询
自连接查询,顾名思义,就是自己连接自己,也就是把一张表连接查询多次。我们先来学习一下自连接
的查询语法:
SELECT 字段列表 FROM 表A 别名A JOIN 表A 别名B ON 条件 ... ;
而对于自连接查询,可以是内连接查询,也可以是外连接查询。
1. 查询员工 及其 所属领导的名字
select a.name '员工姓名' , b.name '领导姓名' from emp a, emp b where a.managerid = b.id;
2. 查询所有员工 emp 及其领导的名字 emp , 如果员工没有领导, 也需要查询出来
select a.name '员工姓名' , b.name '领导姓名' from emp a left join emp b on a.managerid = b.id;
2. 联合查询
对于union查询,就是把多次查询的结果合并起来,形成一个新的查询结果集。
SELECT 字段列表 FROM 表A ...
UNION [ ALL ]
SELECT 字段列表 FROM 表B ....;
- 对于联合查询的多张表的列数必须保持一致,字段类型也需要保持一致。
- union all 会将全部的数据直接合并在一起,union 会对合并之后的数据去重。
1.将薪资低于 5000 的员工 , 和 年龄大于 50 岁的员工全部查询出来.
当前对于这个需求,我们可以直接使用多条件查询,使用逻辑运算符 or 连接即可。 那这里呢,我们
也可以通过union/union all来联合查询.
- union all查询出来的结果,仅仅进行简单的合并,并未去重。
- union 联合查询,会对查询出来的结果进行去重处理。
select * from emp where salary < 5000
union
select * from emp where age > 50;
⑥:子查询
1. 概述
SQL语句中嵌套SELECT语句,称为嵌套查询,又称子查询。
SELECT * FROM t1 WHERE column1 = ( SELECT column1 FROM t2 );
子查询外部的语句可以是INSERT / UPDATE / DELETE / SELECT 的任何一个。
-
根据子查询结果不同,分为:
- 标量子查询(子查询结果为单个值)
- 列子查询(子查询结果为一列)
- 行子查询(子查询结果为一行)
- 表子查询(子查询结果为多行多列)
-
根据子查询位置,分为:
- WHERE之后
- FROM之后
- SELECT之后
2. 标量子查询
子查询返回的结果是单个值(数字、字符串、日期等),最简单的形式,这种子查询称为标量子查询。
常用的操作符:= <> > >= < <=
1. 查询 “销售部” 的所有员工信息
- 完成这个需求时,我们可以将需求分解为两步:
- 查询 “销售部” 部门ID
- 根据 “销售部” 部门ID, 查询员工信息
select * from emp where dept_id = (select id from dept where name = '销售部');
2. 查询在 “方东白” 入职之后的员工信息
- 完成这个需求时,我们可以将需求分解为两步:
- 查询 方东白 的入职日期
- 查询指定入职日期之后入职的员工信息
select * from emp where entrydate > (select entrydate from emp where name = '方东白');
3. 列子查询
子查询返回的结果是一列(可以是多行),这种子查询称为列子查询。
常用的操作符:IN 、NOT IN 、 ANY 、SOME 、 ALL
1. 查询 “销售部” 和 “市场部” 的所有员工信息
分解为以下两步
- 查询 “销售部” 和 “市场部” 的部门ID
- 根据部门ID, 查询员工信息
select * from emp where dept_id in (select id from dept where name in ('销售部', '市场部'));
2. 查询比 财务部 所有人工资都高的员工信息
分解为以下两步
- 查询所有 财务部 人员工资
- 比 财务部 所有人工资都高的员工信息
select * from emp where salary > all (select salary from emp where dept_id = (select id from dept where name = '财务部'));
3. 查询比研发部其中任意一人工资高的员工信息
分解为以下两步
- 查询研发部所有人工资
- 比研发部其中任意一人工资高的员工信息
select * from emp where salary > any (select salary from emp where dept_id = (select id from dept where name = '研发部'));
4. 行子查询
子查询返回的结果是一行(可以是多列),这种子查询称为行子查询。
常用的操作符:= 、<> 、IN 、NOT IN
1. 查询与 “张无忌” 的薪资及直属领导相同的员工信息 ;
这个需求同样可以拆解为两步进行:
- 查询 “张无忌” 的薪资及直属领导
- 查询与 “张无忌” 的薪资及直属领导相同的员工信息 ;
select * from emp where (salary, managerid) = (select salary, managerid from emp where name = '张无忌');
5. 表子查询
常用的操作符:IN
1. 查询与 “鹿杖客” , “宋远桥” 的职位和薪资相同的员工信息
分解为两步执行:
- 查询 “鹿杖客” , “宋远桥” 的职位和薪资
- 查询与 “鹿杖客” , “宋远桥” 的职位和薪资相同的员工信息
select * from emp where (salary, managerid) in (select salary, managerid from emp where name in ('鹿杖客', '宋远桥'));
2. 查询入职日期是 “2006-01-01” 之后的员工信息 , 及其部门信息
分解为两步执行:
- 入职日期是 “2006-01-01” 之后的员工信息
- 查询这部分员工, 对应的部门信息;
select e.*, dept.name from (select * from emp where entrydate > '2006-01-01') e left join dept on e.dept_id = dept.id;
⑦:多表查询案例
1. 数据准备
2. 案例
1. 查询员工的姓名、年龄、职位、部门信息 (隐式内连接)
- 表: emp , dept
- 连接条件: emp.dept_id = dept.id
select emp.name, emp.age, emp.job, dept.name from emp, dept where emp.dept_id = dept.id;
2. 查询年龄小于30岁的员工的姓名、年龄、职位、部门信息(显式内连接)
- 表: emp , dept
- 连接条件: emp.dept_id = dept.id
select emp.name, emp.age, emp.job, dept.name from emp join dept on emp.dept_id = dept.id where emp.age < 30;
3. 查询拥有员工的部门ID、部门名称
- 表: emp , dept
- 连接条件: emp.dept_id = dept.id
select distinct d.id , d.name from emp e , dept d where e.dept_id = d.id;
4. 查询所有年龄大于40岁的员工, 及其归属的部门名称; 如果员工没有分配部门, 也需要展示出来(外连接)
- 表: emp , dept
- 连接条件: emp.dept_id = dept.id
select e.name, d.name from emp e left join dept d on d.id = e.dept_id where e.age > 40;
5. 查询所有员工的工资等级
- 表: emp , salgrade
- 连接条件: emp.salary >= salgrade.losal and emp.salary <= salgrade.hisal
select e.*, s.grade from emp e join salgrade s where e.salary between s.losal and s.hisal;
6. 查询 “研发部” 所有员工的信息及 工资等级
- 表: emp , salgrade , dept
- 连接条件: emp.salary between salgrade.losal and salgrade.hisal ,
emp.dept_id = dept.id - 查询条件 : dept.name = ‘研发部’
select e.*, s.grade
from emp e join salgrade s
where e.salary between s.losal and s.hisal
and e.dept_id = (select id from dept d where d.name = '研发部');
7. 查询 “研发部” 员工的平均工资
- 表: emp , dept
- 连接条件: emp.dept_id = dept.id
select avg(e.salary) from emp e join dept d on d.id = e.dept_id where d.name = '研发部';
8. 查询工资比 “灭绝” 高的员工信息。
- 查询 “灭绝” 的薪资
- 查询比她工资高的员工数据
select * from emp where salary > (select salary from emp where name = '灭绝');
9. 查询比平均薪资高的员工信息
- 查询员工的平均薪资
- 查询比平均薪资高的员工信息
select * from emp where salary > (select avg(salary) from emp);
10. 查询低于本部门平均工资的员工信息
- 查询指定部门平均薪资
- 查询低于本部门平均工资的员工信息
select * from emp e2 where e2.salary < ( select avg(e1.salary) from emp e1 where e1.dept_id = e2.dept_id );
11. 查询所有的部门信息, 并统计部门的员工人数
select d.id, d.name, ( select count(*) from emp e where e.dept_id = d.id ) '人数' from dept d;
⑧:小结
二、事务
①:事务简介
事务是一组操作的集合,它是一个不可分割的工作单位,事务会把所有的操作作为一个整体一起向系
统提交或撤销操作请求,即这些操作要么同时成功,要么同时失败。
②:事务操作
1. 数据准备
-- 数据准备
create table account(
id int auto_increment primary key comment '主键ID',
name varchar(10) comment '姓名',
money int comment '余额'
) comment '账户表';
insert into account(id, name, money) VALUES (null,'张三',2000),(null,'李四',2000);
-- 恢复数据
update account set money = 2000 where name = '张三' or name = '李四';
2. 操作
1. 方式一 设置为手动提交
-- 查询事务提交方式 1:自动提交 0:手动提交
select @@autocommit;
-- 设置事务提交方式为手动提交
set @@autocommit = 0;
-- 转账操作 (张三给李四转账1000)
-- 1. 查询张三账户余额
select * from account where name = '张三';
-- 2. 将张三账户余额-1000
update account set money = money - 1000 where name = '张三';
程序执行报错 ...
-- 3. 将李四账户余额+1000
update account set money = money + 1000 where name = '李四';
-- 提交事务
commit;
-- 回滚事务
rollback ;
2.方式二 开启事务 START TRANSACTION 或 BEGIN;
-- 转账操作 (张三给李四转账1000)
start transaction ;
-- 1. 查询张三账户余额
select * from account where name = '张三';
-- 2. 将张三账户余额-1000
update account set money = money - 1000 where name = '张三';
程序执行报错 ...
-- 3. 将李四账户余额+1000
update account set money = money + 1000 where name = '李四';
-- 提交事务
commit;
-- 回滚事务
rollback;
③:事务四大特性
- 原子性(Atomicity):事务是不可分割的最小操作单元,要么全部成功,要么全部失败。
- 一致性(Consistency):事务完成时,必须使所有的数据都保持一致状态。
- 隔离性(Isolation):数据库系统提供的隔离机制,保证事务在不受外部并发操作影响的独立环境下运行。
- 持久性(Durability):事务一旦提交或回滚,它对数据库中的数据的改变就是永久的
上述就是事务的四大特性,简称ACID。
④:并发事务问题
1.赃读一个事务读到另外一个事务还没有提交的数据。
比如B读取到了A未提交的数据。
2.不可重复读: 一个事务先后读取同一条记录,但两次读取的数据不同,称之为不可重复读。
事务A两次读取同一条记录,但是读取到的数据却是不一样的。
3.幻读: 一个事务按照条件查询数据时,没有对应的数据行,但是在插入数据时,又发现这行数据
已经存在,好像出现了 “幻影”。
⑤:事务隔离级别
为了解决并发事务所引发的问题,在数据库中引入了事务隔离级别。
主要有以下几种:
1.查看事务隔离级别
SELECT @@TRANSACTION_ISOLATION;
2.设置事务隔离级别
SET [ SESSION | GLOBAL ] TRANSACTION ISOLATION LEVEL { READ UNCOMMITTED |
READ COMMITTED | REPEATABLE READ | SERIALIZABLE }
注意:事务隔离级别越高,数据越安全,但是性能越低。
⑥ 并发事务问题演示
由于是并发情况下出现的问题,所有创建了两个窗口模拟两个线程
1. Read uncommitted(读未提交)
- 读未提交: 在并发情况下会出现
脏读
、不可重复读
、幻读
的问题
1.将事务隔离级别设置为
读未提交
并开启事务
-- 设置事务级别
set session transaction isolation level read uncommitted;
-- 查询事务级别
select @@transaction_isolation;
-- 开启事务
start transaction;
2.脏读演示
-- 一、1号窗口先查询
-- 二、2号窗口修改数据(注意:修改后先不提交)
-- 三、1号窗口在查询(此时一号查询到了2号窗口修改后未提交的数据)称之为脏读
- 最后提交每个窗口的事务
3.不可重复读演示
- 每个窗口都重新开启事务;
start transaction
-- 一、1号窗口先查询
-- 二、2号窗口修改数据(注意:修改后提交)
-- 三、1号窗口在查询(此时一号在同一个事务中查询到了不一样的数据)称之为不可重复读
- 最后提交每个窗口的事务
4.幻读演示
- 每个窗口都重新开启事务;
start transaction
-- 一、1号窗口先查询某一条id=3的数据(数据不存在)
-- 二、2号窗口插入一条id=3的数据,并且提交
-- 三、1号窗口插入id=3的数据,出现错误(插入一条查询不到的数据,但是插入时又提示已经存在)称之为幻读
- 最后提交每个窗口的事务
2. Read committed(读已提交)
- 读已提交(Oracle默认): 在并发情况下会出现
不可重复读
、幻读
的问题
1.将事务隔离级别设置为
读已提交
并开启事务
-- 设置事务级别
set session transaction isolation level read committed;
-- 查询事务级别
select @@transaction_isolation;
-- 开启事务
start transaction;
2.脏读演示
- 每个窗口都重新开启事务;
start transaction
-- 一、1号窗口先查询
-- 二、2号窗口修改数据(注意:修改后先不提交)
-- 三、1号窗口在查询(此时一号没有查询到2号窗口修改后未提交的数据)所以不存在脏读
- 最后提交每个窗口的事务
3.不可重复读演示
可以查看 Read uncommitted(读未提交) 的演示
4.幻读演示
可以查看 Read uncommitted(读未提交) 的演示
3. Repeatable Read(可重复读)
- 可重复读(MySQL默认): 在并发情况下会出现
幻读
的问题
1.将事务隔离级别设置为
可重复读
并开启事务
-- 设置事务级别
set session transaction isolation level Repeatable Read;
-- 查询事务级别
select @@transaction_isolation;
-- 开启事务
start transaction;
1.脏读演示
可以查看 Read committed(读已提交) 的演示
2.不可重复读演示
- 每个窗口都重新开启事务;
start transaction
-- 一、1号窗口先查询
-- 二、2号窗口修改数据(注意:修改后提交)
-- 三、1号窗口在查询(此时一号在同一个事务中查询到了一样的数据)`不存在` `不可重复读`
- 最后提交每个窗口的事务
3.幻读演示
可以查看 Read uncommitted(读未提交) 的演示
4. Serializble(可串行化)
- 可串行化: 在并发情况下都不会出现
脏读
、不可重复读
、幻读
的问题
4.将事务隔离级别设置为
可串行化
并开启事务
-- 设置事务级别
set session transaction isolation level Serializble;
-- 查询事务级别
select @@transaction_isolation;
-- 开启事务
start transaction;
2.脏读演示
可以查看 Read committed(读已提交) 的演示
3.不可重复读演示
可以查看 Repeatable Read(可重复读) 的演示
4.幻读演示
- 每个窗口都重新开启事务;
start transaction
-- 一、1号窗口先查询某一条id=3的数据(数据不存在)
-- 二、2号窗口插入一条id=3的数据(此时会发现sql会处于阻塞状态)等待1号窗口的事务提交
-- 三、1号窗口插入id=3的数据(并提交)
-- 四、当1号窗口提交事务后 2号窗口才开始执行,执行时发现已经存在了
-- 五、这样就不存在幻读的问题了,但是性能不好
- 最后提交每个窗口的事务