文章目录
- 一、数据库约束
- 1.1 约束类型
- 1.2 NULL约束
- 1.3 UNIQUE:唯一约束
- 1.4 DEFAULT:默认值约束
- 1.5 PRIMARY KEY:主键约束
- 1.6 FOREIGN KEY:外键约束
- 1.7 CHECK 约束(了解)
- 二、表的设计
- 2.1 一对一
- 2.2 一对多
- 2.3 多对多
- 三、新增
- 四、查询
- 4.1 聚合查询
- 4.1.1 聚合函数
- 4.1.2 GROUP BY 子句
- 4.1.3 HAVING
- 4.2 联合查询
- 4.2.1 内连接
- 4.2.2 外连接
- 4.2.3 自链接
- 4.2.4 子查询
- 4.2.5 合并查询
- 五、重点总结
一、数据库约束
数据库约束:数据库会自动对数据的合法性进行校验检查的一系列机制,来保证数据库中能够避免插入或修改一些非法的数据。
1.1 约束类型
- NOT NULL:指某列不能存储NULL值
- UNIQUE:保证某列的值唯一
- DEFAULT:是没有给列赋值时的默认值
- PRIMARY KEY:NOT NULL 和 UNIQUE的结合,确保某列(或多个列的结合)有唯一标识,称之为主键
- FOREIGN KEY: 保证一个表中的数据匹配另一个表中的值的参照完整性
- CHECK :保证列中的值符合指定的条件
1.2 NULL约束
创建表时,指定某列不为空:
CREATE TABLE student2(
id int NOT NULL,
sn int ,
name varchar(20)
);
1.3 UNIQUE:唯一约束
指定某个列的值是唯一的,会对插入和修改操作进行限制
DROP TABLE IF EXISTS student2;
CREATE TABLE student2(
id int NOT NULL,
sn int UNIQUE,
name varchar(20)
);
1.4 DEFAULT:默认值约束
指定插入数据时,某个列没有赋值时有一个自定义的默认值“未知”,如果没有定义默认值,会使用MySQL自己定义的默认值 NULL。
DROP TABLE IF EXISTS student2;
CREATE TABLE student2(
id int NOT NULL,
sn int UNIQUE,
name varchar(20) DEFAULT '未知'
);
INSERT INTO student2 VALUES(1,10000,NULL);
INSERT INTO student2(id,sn) VALUES(2,10001);
INSERT INTO student2 VALUES(3,10002,'唐三藏');
1.5 PRIMARY KEY:主键约束
指定某一列(或多个列的结合)为主键。对有主键的表来说,每次插入或修改数据,会先进行查询操作。
DROP TABLE IF EXISTS student2;
-- 指定id为主键
CREATE TABLE student2(
id int NOT NULL PRIMARY KEY,
sn int UNIQUE,
name varchar(20) DEFAULT '未知'
);
对于整数类型的主键,常搭配自增长 auto_increment来使用,插入数据对应字段不给值时,会自动分配,使用最大值+1;如果手动指定了id ,最大值也会更新
-- 主键是 NOT NULL 和 UNIQUE 的结合,可以不用 NOT NULL
id int PRIMARY KEY AUTO_INCREMENT,
-- NULL 是让数据库自行分配
INSERT INTO student2 VALUES
(NULL,10000,'唐三藏'),
(NULL,10001,'孙悟空'),
(NULL,10002,'猪悟能');
INSERT INTO student2 VALUES
(5,10004,'宋江'),
(NULL,10005,'武松');
拓展:
但是在这里 id 的自动分配有一定局限性。如果是单个mysql服务器,是没问题的;如果是分布式系统,有多个mysql服务器构成的集群,这时依靠自增主键就不行了。
分布式系统应用在面临的数据量很大(大数据),客户端的请求量比较大(高并发),一台服务器就搞不定了,需要多台服务器(分布式)。
一台服务器主机的硬盘空间有限,当有一个表或几个表,数据量特别大,就要使用分库分表来存储,如果这时需要插入一个商品,那商品id如何分配?如何保证存放商品的数据库中的id与其他的数据库id不重复呢?
分布式系统中有生成唯一id的算法,实现算法方式有很多,但又一个通用公式:分布式唯一id = 时间戳+机房编号/主机编号+随机因子(这里的+ 是字符串拼接,而不是算术相加)。
如果添加商品速度比较慢,直接使用时间戳就可以;但一个时间戳内要添加多个商品,是要落到不同的主机上,保证同一时间添加到不同主机上的上的商品编号是不同的,随机因子有概率生成相同因子,但概率很小,在一定范围内,误差很小可以忽略不计。
1.6 FOREIGN KEY:外键约束
外键用于关联其他表的主键或唯一键。
语法:
-- REFERENCES 英语有参考意思,在这里是说 列名1 参考其他表的 列名2,也就是说 列名1的值必须在列名2中出现过
-- 外键的值依赖于主键的值
FOREIGN KEY (列名1) REFERENCES 表名(列名2)
示例:创建班级表classes,id为主键
CREATE TABLE classes (
id int PRIMARY KEY AUTO_INCREMENT,
name varchar(20),
caparity int
);
创建学生表student,一个学生对应一个班级,一个班级对应多个学生。使用id为主键,classes_id为外键,关联班级表id
CREATE TABLE student3 (
stuId int PRIMARY KEY AUTO_INCREMENT,
stuNum int UNIQUE,
stuName varchar(20) DEFAULT '未知',
classesId int,
FOREIGN KEY (classesId) REFERENCES classes(id)
);
-- 插入班级信息
INSERT INTO classes values(21070501,'软工一班',40),(21070502,'软工二班',40),(21070503,'软工四班',40);
-- 插入学生信息
INSERT INTO student3 values(410180,2107211001,'张三',21070501);
-- 在子表(参照表)执行插入和更新操作时会自动在相应的表进行查询是否已经存在,若不存在,操作就会失败
INSERT INTO student3 values(410181,2107211002,'李四',21070504);
-- 在父表(被参照表),执行更新操作时,会自动查询被参照列的值是否被引用,若被引用,操作就会失败
UPDATE classes SET id = 21070504 where id = 21070501;
UPDATE classes SET name = '软一' where name = '软工一班';
-- 在父表(被参照表),执行删除操作时,删除操作是删除满足条件的一行或多行记录的数据,只要涉及被参照列的值 被引用的操作都会失败(和上述表述基本相同)
delete from classes where name = '软工一班';
delete from classes where name = '软工四班';
如果要清空(delete)父表(被参照表),必须先将所有主键被引用的所有子表(参照表)中外键所在行的记录清空,删除表也是同样道理。
DELETE FROM student3;
DELETE FROM classes;
1.7 CHECK 约束(了解)
MySQL使用时不报错,但忽略该约束。
DROP TABLE IF EXISTS student3;
CREATE TABLE student3 (
stuId int PRIMARY KEY AUTO_INCREMENT,
stuNum int UNIQUE,
stuName varchar(20) DEFAULT '未知',
stuSex varchar(1),
CHECK (stuSex = '男' or stuSex ='女'),
classesId int,
FOREIGN KEY (classesId) REFERENCES classes(id)
);
二、表的设计
2.1 一对一
2.2 一对多
2.3 多对多
- 创建课程表
CREATE TABLE course (
id INT PRIMARY KEY auto_increment,
name VARCHAR(20)
);
- 创建学生课程中间表,考试成绩表
CREATE TABLE score (
id int PRIMARY KEY auto_increment,
score DECIMAL(3, 1),
student_id int,
course_id int,
FOREIGN KEY (student_id) REFERENCES student(id),
FOREIGN KEY (course_id) REFERENCES course(id)
);
三、新增
语法:
-- 插入查询结果 要求列的个数和类型一一对应
INSERT INTO 表名[(列名[, 列名...])] SELECT ...
示例:创建一张用户表,设计有name姓名、email邮箱、sex性别、mobile手机号字段。需要把已有的
学生数据复制进来,可以复制的字段为name、stuSex
-- 创建用户表
CREATE TABLE user (
id INT primary key auto_increment,
name VARCHAR(20) comment '姓名',
age int comment '年龄',
email VARCHAR(20) comment '邮箱',
sex varchar(1) comment '性别',
mobile varchar(20) comment '手机号'
);
-- 将学生表中指定数据复制到用户表
insert into user(name, sex) select name, stuSex from student3
四、查询
4.1 聚合查询
4.1.1 聚合函数
常见的统计总数、计算平局值等操作,可以使用聚合函数来实现,常见的聚合函数有:
示例:
- COUNT
-- 统计student表里有多少个学生
select count(*) from student;
--统计有多少个id,值为 NULL 的不会被 COUNT 统计
select count(id) from student;
--创建新的学生表,课程表,还有成绩表
create table course(
id int primary key auto_increment comment '课程号',
name varchar(20) comment '课程名'
);
create table student(
id int unique auto_increment comment '身份证号',
sn int primary key comment '学号',
name varchar(20) comment '姓名'
);
create table stu_grade(
sn int comment '学号',
course_Id int comment '课程号',
grade decimal(3,1) comment '成绩',
primary key (sn,course_Id),
foreign key(sn) references student(sn),
foreign key(course_Id) references course(id)
);
-- 插入数据
insert into student values(202311301,1001,'李四'),
(202311302,1002,'张三'),
(202311303,1003,'王五');
insert into course values(1,'计算机网络'),
(2,'数据结构与算法'),
(3,'计算机组成原理'),
(4,'数据库系统概论');
insert into stu_grade values(1001,1,87.5),(1001,2,77),(1001,3,90),(1001,4,65.5);
insert into stu_grade values(1002,1,80),(1002,2,90.5),(1002,3,67),(1002,4,83.5);
insert into stu_grade values(1003,1,78.5),(1003,2,90.5),(1003,3,84),(1003,4,93);
- SUM
--统计课程号为1的总成绩
select sum(grade) from stu_grade where course_Id = 1;
--统计课程号为1的不及格(<60)的总分,没有结果返回NULL
select sum(grade) from stu_grade where course_Id = 1 and grade < 60;
- AVG
-- 统计课程号为1的平均成绩
select avg(grade) from stu_grade where course_Id = 1;
- MAX
-- 查找课程号为1的最高分
select max(grade) from stu_grade where course_Id = 1;
- MIN
-- 查找课程号为1的最低分
select max(grade) from stu_grade where course_Id = 1;
4.1.2 GROUP BY 子句
group by 针对指定列进行分组,将值相同的分到同一组中,再对分的组使用聚合函数。
语法:
select column1 [, sum(column2), ..] from table group by column1,column3;
示例:
-- 查询每门课程的总成绩
select course_Id,sum(grade) from stu_grade group by course_Id;
-- 不使用聚合函数 ,查询的结果是一组的某个代表数据
select course_Id,grade from stu_grade group by course_Id;
group by 往往要搭配聚合函数使用,否则查询结果就没有意义
4.1.3 HAVING
group by 子句进行分组以后,需要对分组结果再进行条件过滤时,不能使用where语句,而是用 having
示例:
-- 挑选出所有课程中总分最低于250的
select course_Id,sum(grade) from stu_grade group by course_Id having sum(grade) < 250;
4.2 联合查询
实际开发中往往数据来自不同的表,所以需要多表联合查询。多表查询是对多张表的数据取笛卡尔积:
同时,联合查询可以对表取别名
以上述4.1创建的course、student、stu_grade 三张表及插入的数据为例
4.2.1 内连接
语法:
select 字段 from 表1 别名1 [inner] join 表2 别名2 on 连接条件 and 其他条件;
select 字段 from 表1 别名1,表2 别名2 where 连接条件 and 其他条件;
示例:
-- 查询学生李四的每门课程的成绩
select student.sn,student.name,course.name,grade from student,course,stu_grade
where student.sn = stu_grade.sn and
stu_grade.course_Id = course.id and
student.name ='李四';
4.2.2 外连接
外连接分为左外连接和右外连接。如果联合查询,左侧的表完全显示我们就说是左外连接;右侧的表完全显示我们就说是右外连接。
语法:
-- 左外连接,表1完全显示
select 字段 from 表名1 left join 表名2 on 连接条件;
-- 右外连接,表2完全显示
select 字段 from 表名1 right join 表名2 on 连接条件;
-- 插入一条没有考试的学生的信息
insert into student values(202311304,1004,'王麻子');
-- 查找所有学生的成绩--要求没有考试的学生也要显示出来
select student.sn,name,course_Id,grade from student left join stu_grade on student.sn = stu_grade.sn;
4.2.3 自链接
自连接是指在同一张表连接自身进行查询
示例:
-- 查询 计算机网络成绩比数据结构与算法好的学生信息和成绩
-- 先查询 计算机网络 比 课程 数据结构与算法 的课程号
select id,name from sourse where name ='计算机网络' or name ='数据结构与算法';
-- 查询计算机网络成绩比数据结构与算法成绩高的信息
select s1.sn,s1.grade '计算机网络',s2.grade '数据结构与算法'
from stu_grade s1,stu_grade s2
where s1.course_Id = 1 and
s2.course_Id = 2 and
s1.sn = s2.sn and
s1.grade > s2.grade;
以上查询只显示了成绩信息,并且是分布执行的,要显示学生及成绩信息且用一条语句实现:
select student.*,s1.grade '计算机网络',s2.grade '数据结构与算法'
from student,stu_grade as s1,stu_grade as s2 ,course as c1,course as c2
where student.sn = s1.sn and
s1.sn = s2.sn and
c1.name = '计算机网络' and
c2.name = '数据结构与算法' and
s1.course_Id = c1.id and
s2.course_Id = c2.id and
s1.grade > s2.grade;
4.2.4 子查询
子查询是指嵌入在其他sql语句中的select语句,也叫嵌套查询
- 单行子查询:返回一行记录的子查询
示例 :查询 上数据结构与算法课程的同学
select student.sn,student.name from student,stu_grade
where student.sn = stu_grade.sn and
stu_grade.course_Id = (select id from course where course.name ='数据结构与算法');
- 多行子查询:返回多行记录的子查询
示例:查询计算机网络或计算机组成原理课程的成绩信息 - 使用(not) in 关键字
-- 用 in 关键字 select * from stu_grade where course_id in ( select id from course where name='计算机网络' or name='计算机组成原理');
– 用 not in 关键字
select * from score where course_id not in (
select id from course where name!=‘语文’ and name!=‘英文’);
```
- 使用(not)exists 关键字(了解)
-- 使用 exists select * from stu_grade where exists ( select course_Id from course where (name='计算机网络' or name='计算机组成原理') and id = course_Id); -- 使用 not exists select * from stu_grade where not exists ( select course_Id from course where (name !='计算机网络' and name !='计算机组成原理') and id = course_Id);
- 在from子句中使用子查询:子查询语句出现在from子句中。这里要用到数据查询的技巧,把一个子查询当做一个临时表使用(了解)
4.2.5 合并查询
在实际应用中,为了合并多个select的执行结果,可以使用集合操作符 union,union all。使用UNION 和 UNION ALL时,前后查询的结果集中,字段需要一致
- union
该操作符用于取得两个结果集的并集。使用该操作符会自动去掉结果集中的重复行
示例: 查询课程号小于3或者名字为 数据库系统概论的课程
select * from course where id < 3 union select * from course where name = '数据库系统概论';
--使用 or 实现
select * from course where id < 3 or name = '数据库系统概论';
- union all
该操作符用于取得两个结果集的并集。使用该操作符时不会去掉结果集中的重复行
示例:查询课程号小于3或者名字为 数据结构与算法的课程
select * from course where id < 3 union all select * from course where name = '数据结构与算法';
五、重点总结
- 数据约束
- NULL约束——使用NOT NULL 指定列不为空
- UNIQUE唯一约束——指定列唯一,不重复
- DEFAULT默认值约束—— 指定列为空时的默认值
- PRIMARY KEY主键约束——NOT NULL 和UNIQUE的结合
- FOREIGN KEY 外键约束——关联其他表的主键或唯一键 foreign key(列) references 其他表(列)
- CHECK约束(了解)——保证列中的值符合指定条件,例:check (sex =‘男’ or sex=‘女’)
- 表的关系
- 一对一
- 一对多
- 多对多
- 新增
– select 的列的数量和类型与插入的要保持一致
insert into 表名 [ 列1, [列2, ,…] ] select …
-
查询
- 聚合函数 :COUNT,SUM,AVG,MAX,MIN,
- 分组查询:GROUP BY … HAVING…(用于分组后进行条件过滤)
- 内连接:
select … from 表1,表2 where 条件
select … from 表1 [inner] join 表2 on 条件- 外连接
left 左外连接 ,表1 全部显示,如果表2没有,对应列置空
select … from 表1 left / right join 表2 on 条件right 右外连接 ,表2 全部显示,如果表1没有,对应列置空
select … from 表1 left / right join 表2 on 条件- 自连接
select … from 表1 ,表1 where 条件
select … from 表1 join 表1 on 条件- 子查询(嵌套查询)
– 单行子查询
select … from 表 where 列 = (select … from …)
– 多行子查询
select … from 表 where 列 in (select … from …)
– from 中的子查询 — 临时表
select … from 表 (select … from …)as tmp where 条件- 合并查询(可以合并不同的表)
– union:去除重复数据的合并查询 ,以第1个select 查询的列作为合并后的首要的列
select … from … where 条件 union select … from … where 条件– union all:不去除重复数据的合并查询
select … from … where 条件 union all select … from … where 条件
SQL查询中各个关键字的执行先后顺序: from > on> join > where > group by > with > having >select > distinct > order by > limit