目录
- 1.数据库约束:
- 1.1 约束的类型:
- 1.2 unique:
- 1.3 primary key:
- 1.3.1 分布式系统下,自增主键如何生成唯一id:
- 1.4 foreign key:
- 1.4.1 逻辑删除:
- 2.表的设计/数据库的设计:
- 2.1 数据库是如何设计的?
- 3.进阶插入操作:
- 4.进阶查询:
- 4.1 聚合查询:
- 4.2 group by 列名:
- 4.3 联合查询/多表查询:
- 4.3.1 内连接:
- 4.3.2 外连接:
- 4.3.3 自连接:
- 4.4 子查询:
- 4.5 合并查询:
1.数据库约束:
- 数据库约束是
对数据库中的记录做出更详细的检查
(检查数据是否合法,不能完全靠人工来检查) - 和interface/abstract class的作用效果是类似的.
1.1 约束的类型:
(对于数据库中的记录做出更详细的检查)
类型 | 说明 |
---|---|
not null | 要求指定的列非空 |
unique | 表示值是唯一的, 触发查询 |
default | 本来默认值是null, default会修改默认值 |
primary key | 主键,针对每一条记录,作为身份标识 |
foreign key | 外键, 触发查询 |
和NULL比较:
= 或者 != 都不能和NULL比较
<=> 或者 is null 或者 is not null 可以和NULL比较
1.2 unique:
-
unique的值唯一,每次插入/修改数据,
都会针对当前的数据在表里进行查找
,看这个值是否能查到!(如果查到了说明不唯一,就修改失败) -
当使用了unique之后,
每次插入操作都会涉及到先查询再插入
的操作.查询这里就涉及到遍历,遍历的效率比较低,因此就用到了索引! -
使用unique约束,数据库就会
自动的给对应的列创建索引.
1.3 primary key:
-
就类似与身份证,作为一个人的身份标识一样.
-
主键是一个身份标识
,既要保证唯一性又不能为空
;因此primary key相当于是unique + not null;
-
一个表里,主键只能有一个
, unique则是可以有多个的. -
使用主键需要给这个列设置一个唯一的值,如果这个分配值的工作人工来完成的话就很麻烦(需要人工来保证使用的身份标识没有重复), 因此MySQL中就引入了一个机制自增主键(通过自增这样的方法来给主键设置值).
-
使用自增主键
primary key auto_increment
的时候,就不需要手动来设置值了,只需要把这一列设置为null即可. -
虽然自增主键是自动分配的,但是也能手动设置.
-
自增主键可以理解成是数据库里记录了当前最大的id是多少,
每次都是从最大值之后再进行增加的
.
1.3.1 分布式系统下,自增主键如何生成唯一id:
-
如果数据库服务器就一个,那自增主键就可以保证主键的唯一性,但是如果数据时分布式部署的(数据太大了,一台机器存放不下,使用多台机器存储).这个时候就要分库分表.但是这些数据逻辑上还是同一张表只不过是存储在不同的机器上,此时原有的自增主键就失效了(MySQL的自增主键只能保证单机上不会重复,不能保证分布式部署不重复).
-
分布式系统下生成唯一ID的算法:
生成公式 = (时间戳 + 机房编号 / 主机的编号 + 随机因子) => 计算 哈希值;
-
随机因子:随机数,理论上保证不了俩次生成的随机数是不同的,但是工程上实验上
随机因子冲突的概率是非常小的因此就忽略不计了.
1.4 foreign key:
-
作用是
把俩张表关联起来.
-
例如:现有学生表和班级表.学生表里的每个记录中都包含了班级编号,这个班级编号要在班级表中存在!
-
举个例子,有一天一个人加我好友,说是和我一个专业的3班的同学,我一听就不对劲.俺们专业没有3班呐. 这就叫外键约束.
-
班级表就对学生表产生了约束.班级表(约束别人的表)称为是父表;学生表(收到约束的表)称为是子表;
-
在外键的约束下插入数据会触发查询
.往学生表中插入数据就会自动的在班级表中查询,看这个classId是否存在
, 如果存在则插入成功,否则插入失败. -
这里也有要求,子表中引用
父表的这一列,务必是primary key 或者 unique
. 这里指的是父表. -
在外键中,父表对于子表产生了约束.子表也是会对父表有约束的.
如果在子表存在的情况下,直接删除父表就会出现问题.
父表删除记录也要看当前这个记录是否被子表引用
,如果被引用的就不能删除,不被引用的才能删除/修改.
1.4.1 逻辑删除:
- 父表->商品表(goodsId,name,price…); 子表->订单表(orderld,time,goodsld…);如果某个商品下架了,就需要把goodsId给删了,但是子表中引用了父表的goodsId所以删不掉,此时就涉及到了逻辑删除.将商品表的
数据标记成无效,这里说的逻辑删除就是对这个标记位进行修改
. - 但是这样的话,就会导致硬盘空间被持续占用,岂不是很浪费空间嘛??其实硬盘空间很大的,而且很便宜.
2.表的设计/数据库的设计:
2.1 数据库是如何设计的?
- 这个问题从这个几个方面回答: 数据库中有几个表?/每个表都是干啥的?/每个表里都有哪些列?/这些列又是干啥的?
- 数据库设计主要思路:
a)根据需求找到实体
—>b)再梳理清楚实体之间的关系(一对一/一对多/多对多关系)
- 找实体的过程说的就是需求中的关键性的名词,
一般来说每个实体都会安排一个表.
- **一对一关系:**一个人只有一个身份证号,一个身份证也只对应一个人.
- **一对多关系:**一个班级可以包含多个学生,一个学生只属于一个班级.
- **多对多关系:**一个学生可以选择多门课程,一门课程也可以拥有多个学生.多对多的表结构通常需要使用一个"关联表"把俩个实体的表给联系起来.
- 除此之外的关系就是没关系.
3.进阶插入操作:
insert into 表名1 select 列名 from 表名2:
- 可以把查询的结果插入到另一个表中, insert into student2 select * from student1;
把student1里查询出来的结果插入到student2中
. - 这里的插入不一定是把student1里的数据全都插入过去
,也可以只插入一部分(通过条件来筛选)
- insert into student2 select * from student1; 这里
查询的结果的列要和插入的表的列要匹配(列的个数和类型是要匹配)
4.进阶查询:
4.1 聚合查询:
- 查询的时候带表达式是把列和列放到一起进行计算.
聚合查询是行和行放到一起进行计算
- SQL里面提供了一些函数, 通过这些函数就可以进行行和行的运算.
函数 | 说明 |
---|---|
count( ) | 计算行数 |
sum( ) | 针对这一列的若干行之间进行加和,只能针对数值类型 |
avg( ) | 求这一列的若干行的平均值,只能针对数值类型 |
max( ) | 求这一列的若干行的最大值,只能针对数值类型 |
min( ) | 求这一列的若干行的最小值,只能针对数值类型 |
函数: count( ) / sum( ) :
- count(*)是查询结果中有多少行,
即使有一行是空值也会记录到行数里.
- count(列名)如果遇到有一行是空值,
则不会记录.
- sum(列名),如果这一列中有null,
那么null不参与运算,直接跳过.
- sum(列名)这样的运算只能针对数字来进行,
不能针对字符串
.
4.2 group by 列名:
-
可以使用, group by 列名;
来根据查询的结果进行分组操作,把值相同的记录分成一组
,然后就可以针对每一组分别进行聚合了.
-
group by 的效果:
-
如果直接写成select * from emp group by role;展示出的
就是每一组的第一条数据.
-
在进行分组查询的时候,只有用来分组的这一列,可以进行查询,其他的列则必须要
搭配聚合函数来查询.
-
分组查询的时候还可以指定条件,
在分组之前使用条件筛选需要用到where
;在分组之后使用条件查询需要用到having
.(where和having可以同时使用!)
(一) 查询每个岗位的平均薪资(除掉张三的这条记录).先把张三这条记录删掉,再分组.where要写到group by的前面.
(二) 查询平均薪资 > 12000的岗位.先分组算好平均薪资之后再找到大于12000的岗位.having要写到group by后面.
(三) 求除了张三之外.每个岗位的平均薪资并且保留出平均薪资 >= 12000的岗位.
4.3 联合查询/多表查询:
-
要想了解多表查询先了解"笛卡尔积".
-
笛卡尔积就是
简单粗暴的排列组合把所有可能的情况都列出来
,把俩张表的记录放在一起进行排列组合出所有可能的情况. -
笛卡尔积的
列数是俩个表的列数之和
; 笛卡尔积的行数是俩个表的行数之积
.笛卡尔积可以指定列(表达式/别名/去重). -
在进行联合查询的过程就是在计算笛卡尔积的过程,当表比较大的时候,如果进行多表查询就会非常的低效,甚至称为"危险操作".
-
笛卡尔积的有些数据是有意义的,有一些是无意义的,
用来筛选笛卡尔积有效数据的条件称为"连接条件".
-
联合查询/多表查询 = 笛卡尔积 + 连接条件 + 其他条件(根据其他的需求)
-
SQL中的使用来获取到笛卡尔积.(使用 , 或者 使用 join on),有些特定的场景务必需要使用 join on.
4.3.1 内连接:
案例 :
(一) 查询"许仙"同学的成绩;
1.计算student和score的笛卡尔积
select * from student,score;
2.给笛卡尔积加上连接条件
select * from student,score where student.id = score.student_id;
3.根据许仙这个名字,再进行筛选
select * from student,score where student.id = score.student_id and student.name = “许仙”;
4.精简查询的结果,保留关注的,去掉不关注的信息
select name,score from student,score where student.id = score.student_id and student.name = “许仙”;
使用 join on 来完成
select name,score from student join score on student.id = score.student_id and student.name = “许仙”;
(二) 查询所有同学的总成绩(各科之和)
1.计算student和score的笛卡尔积
select * from student,score;
2.加上连接条件
select * from student,score where student.id = score.student_id;
3.分组
select * from student,score where student.id = score.student_id group by name;
4.精简查询的结果
select name,sum(score) from student,score where student.id = score.student_id group by name;
(三) 查询出所有同学的成绩,带课程名的那种
同学名字在学生表里/课程名字在课程表里/分数在分数表里
1.计算三张表的笛卡尔积
select * from student,score,course;
2.给笛卡尔积加上连接条件
select * from student,score,course
where student.id = score.student_id and classes.id = score.course_id;
3.不必加其他的条件了,直接精简即可
select student.name,course.name,score from student,course,score
where student.id = score.student_id and course.id = score.course_id;
使用 join on 来做,更能体现出"俩俩结合"的感觉
select student.name,course.name,score from student join score student.id = score.student_id join course on score.course_id = course.id;
4.3.2 外连接:
from 表1,表2 where …;
这就是内连接
from 表1 join 表2 on …;
使用join/inner join可以作为内连接也可以作为外连接
-
写成
left join 左外连接
/right join 右外连接
. -
如果三个表外连接, 则是A和B先外连接得到一个临时表, 把临时表和C建立连接即可.
-
如果俩张表的数据都是一一对应的时候,其实内连接和外连接看不出来区别
-
如果表上的数据不在一一对应,内连接和外连接区别就非常明显了
.下面的数据中,左侧表的王五同学在右侧表里没有成绩,右侧表中的4号同学在左侧表里没有同学信息. -
左外还是右外,主要还是看表的先后顺序, 是在join的左侧还是右侧.
4.3.3 自连接:
-
自己和自己做笛卡尔积
-
条件查询中核心就是列和列之间的比较,而从来没有
行和行之间的比较
.此处的自连接就是把行转成列.
-
如果这个表很大,那么运行的开销就会很大,可读性也不高.
(一) 显示计算机原理比java成绩高的同学
1.需要的数据都在分数表里,
select * from score as s1,score as s2;
2.加上连接条件
select * from score as s1,score as s2 where s1.student_id = s2.student_id;
3.加上筛选条件
select * from score as s1,score as s2
where s1.student_id = s2.student_id and and s1.course_id = 3 and s2.course_id = 1
and s1.course_id > s2.course_id;
4.4 子查询:
- 本质上就是
把多个查询语句组合成一个查询语句
, 套娃! - 用一个查询的结果的临时表,基于这个临时表再发起另外一组查询
- 如果子查询返回的结果是多条记录,就可以使用 in 来进行子查询.
(一) 查询出与不行毕业同学的同班同学
select name from student where name != “不想毕业” and
classes_id = (select classes_id from student where name = “不想毕业”);
(二) 查询语文或英文课程的成绩信息
select * from score where course_id in (select id from course where name = “语文” or name = “英文”);
4.5 合并查询:
- 使用 union 或者union all 来完成俩个查询的结果合并到一起.如果是一张表那么union的作用和 or 类似,使用or也能完成.如果是俩张表就不能使用or了,使用俩张表合并的话列需要列是匹配的.
- union 是把多个查询的结果集合并成一个,
如果有重复的数据,就会去重.
- union all 合并的时候
如果有重复的数据就不会去重.
(一) 查询课程 id<3 或者名字为英文的课程
select * from course where id < 3 union select * from course where name = “英文”;