MySQL要点学习:你可以在简历上说熟悉MySQL
- 什么是数据库?什么是数据库管理系统?什么是MySQL?什么是SQL?
- 数据库
- 数据库管理系统:
- SQL:结构化查询语言
- 三者之间的关系
- 安装MySQL数据库管理系统
- MySQL常用命令
- SQL语句的分类
- 导入.sql文件到数据库中
- DQL查询语句:select语句
- 简单的查询select...from...
- 条件查询select...from...where...
- 排序查询select...from...order by...
- 数据处理函数(SQL中的API)
- 分组函数(多行处理函数)
- 分组查询(非常重要:五颗星*****)
- 连接查询(非常重要:五颗星*****)
- 子查询
- limit查询(非常重要:五颗星*****)
- DQL语句的大总结
- 表的创建(数据库中最小单元的创建)
- MySQL中的数据类型
- 插入数据insert (DML语句)
- 修改表中数据update(DML语句)
- 删除数据delete (DML语句)
- 约束(非常重要,五颗星*****)
- 非空约束:not null
- 唯一性约束: unique
- 主键约束(primary key,简称PK,非常重要:五颗星*****)
- 外键约束(foreign key,简称FK,非常重要:五颗星*****)
- 存储引擎
- 事务(重点:五颗星*****,必须理解,必须掌握)
- 到底什么是事务呢?对事务的理解是什么呢?
- 事务是怎么做到多条DML语句同时成功和同时失败的呢?
- 怎么提交事务,怎么回滚事务?
- 事务的4个特性
- 重点研究一下事务的隔离性
- 索引(index,非常重要:五颗星*****)
- 什么是索引?
- 假设,我们为name字段添加了索引,那么查找的时候是怎么查找的呢?
- 什么条件下,我们会考虑给字段添加索引呢?
- 索引怎么创建?怎么删除?语法是什么?
- 索引有失效的时候,什么时候索引失效呢?
- 视图(view)
- 数据库设计三范式
- 第一范式
- 第二范式
- 第三范式
什么是数据库?什么是数据库管理系统?什么是MySQL?什么是SQL?
数据库
英文单词DataBase,简称DB。按照一定格式存储数据的一些文件的组合。顾名思义:存储数据的仓库,实际上就是一堆文件。这些文件中存储了具有特定格式的数据。
数据库管理系统:
Data Base Management,简称DBMS。数据库管理系统是专门用来管理数据库中数据的,数据库管理系统可以对数据库当中的数据进行增删改查。
常见的数据库管理系统:MySQL
、Oracle
、MS SqlServer
、DB2
、sybase
等…
所以MySQL其实是一个数据库管理系统,利用SQL语言(或者叫SQL指令)来管理数据库中的数据。
SQL:结构化查询语言
程序员需要学习SQL语句,程序员通过编写SQL语句,然后DBMS(例如:MySQL)负责执行SQL语句,最终来完成数据库中数据的增删改查操作。
SQL是一套标准,程序员主要学习的就是SQL语句,这个SQL在MySQL中可以使用,同时在Oracle中也可以使用,在DB2中也可以使用。
三者之间的关系
数据库管理系统—>执行SQL语句—>去操作数据库DB
DBMS–执行–> SQL --操作–> DB
先安装数据库管理系统MySQL,然后学习SQL语句怎么写,编写SQL语句之后,DBMS对SQL语句进行执行,最终来完成数据库的数据管理。
安装MySQL数据库管理系统
一路安装下去即可
最后我们可以在cmd命令行先练习SQL语句的编写:root是用户名,123456是密码
如果想要在windows运行MySQL服务,需要开启MySQL服务。只有这样,才可以连接上服务器,使用MySQL。
MySQL常用命令
-
退出mysql :exit
-
查看mysql中有哪些数据库:
show databases;
-
怎么选择使用某个数据库:
use bjpowernode;
只有使用了某个数据库,才可以操作该数据库下的数据
-
查看某个数据库下有哪些表:
show tables;
这些表就是我们将来操作的数据的基本单元,所有的数据在数据库中都是存在表里的,我们后续要学的各种增删改查,都是基于表的
SQL语句的分类
SQL语句有很多,最好进行分门别类,这样更容易记忆。
- DQL:数据查询语言(凡是带有select关键字的都是查询语句)
select… - DML:数据操作语言(凡是对表当中的数据进行增删改的都是DML),这个主要是操作表中的数据data。
insert delete update
insert 增
delete 删
update 改 - TCL:是事务控制语言
事务提交:commit;
事务回滚:rollback; - DCL:是数据控制语言
授权grant、撤销权限revoke…
我们最常用的就是查询表中的数据和操作表中的数据,即DQL和DML。
导入.sql文件到数据库中
bjpowernode.sql 这个文件中是我提前为大家练习准备的数据库表。
怎么将sql文件中的数据导入呢?
mysql> source C:\Users\XHB\Desktop\SQL\bjpowernode.sql
我看一下这个数据库里有哪些表?有5个表
DQL查询语句:select语句
简单的查询select…from…
- 从emp表查询所有数据。
select * from emp;
*表示所有数据(其中select
和from
都是SQL语句中的关键字)
- 只想查出部分数据:
select empno,ename,job from emp;
想要查询的字段名以逗号分隔(查询时,不区分字段名的大小写)
- 查询表的结构,即每一列都是什么类型的数据
desc emp;
,describe缩写为:desc
意为表的描述
可以看出,empon
是int类型的,长度是4个数字(数据类型里的数字,不是字节数,就是字符数,4就代表四个数);ename
是可变字符串类型的,长度最长是10个。
- 给查询的列起别名:
select ename,job as work from emp;
用的是as关键字,可以给字段名起一个别名
使用as关键字起别名。
注意:只是将显示的查询结果列名显示为work,原表列名还是叫:job
记住:select语句是永远都不会进行修改操作的。(因为只负责查询)
这很关键,select仅仅就是一个查看数据的语句,怎么查看,想以什么形式进行查看,这是我们可以控制的,但是无法使用select语句更改源数据。
- 查询员工的工资,我想要看看每个月薪水*12是多少,也就是想看年薪是多少:
select ename,sal*12 as yearsal from emp;
可以看出,我想要原本的sal*12呈现在我面前,就可以这么办到,还顺便起了个别名yearsal。
select ename,sal*12 as '年薪' from emp;
//别名是中文,用单引号括起来。
条件查询select…from…where…
什么是条件查询?
不是将表中所有数据都查出来。是查询出来符合条件的。
语法格式:
select
字段1,字段2,字段3....
from
表名
where
条件;
都有哪些条件呢?
= 等于
- 查询薪资等于800的员工姓名和编号?
select empno,ename from emp where sal = 800;
- 查询SMITH的编号和薪资?
select empno,sal from emp where ename = 'SMITH';
//字符串使用单引号
<>或!= 不等于
查询薪资不等于800的员工姓名和编号?select empno,ename from emp where sal != 800;
或者 select empno,ename from emp where sal <> 800;
// 小于号和大于号组成的不等号
< 小于
- 查询薪资小于2000的员工姓名和编号?
select empno,ename,sal from emp where sal < 2000;
<= 小于等于
查询薪资小于等于3000的员工姓名和编号?
select empno,ename,sal from emp where sal <= 3000;
> 大于
查询薪资大于3000的员工姓名和编号?
select empno,ename,sal from emp where sal > 3000;
>= 大于等于
查询薪资大于等于3000的员工姓名和编号?
select empno,ename,sal from emp where sal >= 3000;
between … and …. 两个值之间, 等同于 >= and <=
- 查询薪资在2450和3000之间的员工信息?包括2450和3000
第一种方式:>= and <= (and是并且的意思。)
第二种方式:between … and …
is null 为 null(is not null 不为空)
- 查找某个字段有没有null值,不能使用等于号,这样的话查不出来
这才是正确的判断是不是为null的SQL语句:select empno,ename,sal,comm from emp where comm is null;
在数据库当中null不能使用等号进行衡量。需要使用is null因为数据库中的null代表什么也没有,它不是一个值,所以不能使用等号衡量。
- 查询哪些员工的津贴/补助不为null?
select empno,ename,sal,comm from emp where comm is not null;
and 并且
- 查询工作岗位是MANAGER并且工资大于2500的员工信息?
select
empno,ename,job,sal
from
emp
where
job = 'MANAGER' and sal > 2500;
or 或者
- 查询工作岗位是MANAGER和SALESMAN的员工?(满足任何一个条件的都被查询出来)
select
empno,ename,job
from
emp
where
job = 'MANAGER' or job = 'SALESMAN';
and和or同时出现的话,有优先级问题吗?
- 查询工资大于2500,并且部门编号为10或20部门的员工?
select
*
from
emp
where
sal > 2500 and deptno = 10 or deptno = 20;
分析以上语句的问题?
and优先级比or高。
以上语句会先执行and,然后执行or。
以上这个语句表示什么含义?
找出工资大于2500并且部门编号为10的员工,与前面无关,并且把20部门所有员工都找出来。
这并不是我们想要的结果,我们想要的是,在10或者20部门中,工资大于2500的。我们应该把后面的or括起来,避免优先级问题。
select
*
from
emp
where
sal > 2500 and (deptno = 10 or deptno = 20);
可以看出,找出来的20也都是满足薪资大于2500的。
in 包含,相当于多个 or (not in 不在这个范围中)
- 查询工作岗位是MANAGER和SALESMAN的员工?
经典查法:select empno,ename,job from emp where job = 'MANAGER' or job = 'SALESMAN';
使用in
的查法:select empno,ename,job from emp where job in('MANAGER', 'SALESMAN');
not in
就是查询不是这两个的其他所有:select empno,ename,job from emp where job not in('MANAGER', 'SALESMAN');
排序查询select…from…order by…
- 查询所有员工薪资,按照薪资排序?使用
order by
语句,按照后面的字段对其它字段进行排序,默认升序排列。
select
ename,sal
from
emp
order by
sal asc; // 默认是升序!!!
可以看到,按照sal升序排列了。
select
ename,sal
from
emp
order by
sal desc; // 指定为降序!!!
可以看到,按照sal降序排列了。
可以两个字段排序吗?或者说按照多个字段排序?
- 查询员工名字和薪资,要求按照薪资升序,如果薪资一样的话,再按照名字升序排列。
select
ename,sal
from
emp
order by
sal asc, ename asc; // sal在前,起主导,只有sal相等的时候,才会考虑启用ename排序。
可以看到,当sal一样的时候,按照名字的ASCII升序排列。
综合一点的案例:
- 找出工资在1250到3000之间的员工信息,要求按照薪资降序排列。
select
ename,sal
from
emp
where
sal between 1250 and 3000
order by
sal desc;
数据处理函数(SQL中的API)
数据处理函数又被称为单行处理函数,单行处理函数的特点:一个输入对应一个输出。
和单行处理函数相对的是:多行处理函数。(多行处理函数特点:多个输入,对应1个输出!)
单行处理函数常见的有哪些?
- lower 转换小写,把字段下的数据变为小写
可以看到,14个输入,最后还是14个输出。这是单行处理函数的特点。
- length 取长度,把字段下对应的数据长度取出来
这种单行处理函数,了解即可,知道有啥就行。
分组函数(多行处理函数)
多行处理函数的特点:输入多行,最终输出一行。 类似于,函数有多个参数,但是返回值只有一个。
5个常见的多行处理函数:
- count 计数
- sum 求和
- avg 平均值
- max 最大值
- min 最小值
上面这五个函数,叫做分组函数。
注意:分组函数在使用的时候必须先进行分组,然后才能用。这句话非常重要!!!!!如果你没有对数据进行分组,整张表默认为一组。
- 找出最高工资?输入的是14个sal,返回的就是一个,这就是多行处理函数的特点。
- 找出最低工资?
- 计算工资和?
- 计算平均工资?
- 计算员工数量?
分组函数在使用的时候需要注意哪些?
第一点:分组函数自动忽略NULL,你不需要提前对NULL进行处理。
第二点:分组函数中count(*)和count(具体字段)有什么区别?
count(具体字段):表示统计该字段下所有不为NULL的元素的总数。
count(*):统计表当中的总行数。(只要有一行数据count则++)
注意:因为每一行记录不可能都为NULL,数据库也不允许有一行数据全部为NULL,一行数据中有一列不为NULL,则这行数据就是有效的。
第三点:分组函数不能够直接使用在where子句中。(最最最最重要的一点!!!!!)
- 找出比最低工资高的员工信息。
select ename,sal from emp where sal > min(sal);
这句SQL语句看着没什么问题,但是执行一下:报错:无效的使用分组函数!!!
这是因为,分组函数执行前必须进行分组查询。而SQL语句执行的顺序是where语句在分组查询语句之前,所以执行到where的时候,分组查询语句还没被执行,然后你还想这时候调用分组函数,那就会报错。
分组查询(非常重要:五颗星*****)
什么是分组查询?
在实际的应用中,可能有这样的需求,需要先进行分组,然后对每一组的数据进行操作。这个时候我们需要使用分组查询,怎么进行分组查询呢?
select
...
from
...
group by
...
计算每个部门的工资和?
计算每个工作岗位的平均薪资?
找出每个工作岗位的最高薪资?
…
理解:把部门,工作岗位,单独拎出来算一些东西,这就叫把部门、工作岗位字段,分组了!!!
将之前的关键字全部组合在一起,来看一下他们的执行顺序?
select
...
from
...
where
...
group by
...
order by
...
以上关键字的顺序不能颠倒,需要记忆。
执行顺序是什么?
- from
- where
- group by
- select
- order by
这样顺序的用意大概是:先找到表,然后过滤一些表中原有的数据,然后把一些字段分组,然后查询,最后想要排序输出就排序输出。
再次回答一遍,为什么where后面跟分组函数会报错:为什么分组函数不能直接使用在where后面?
select ename,sal from emp where sal > min(sal);
//报错。
1、因为分组函数在使用的时候必须先分组之后才能使用。
2、where执行的时候,还没有分组。所以where后面不能出现分组函数。
另一个例子:
select sum(sal) from emp;
这个没有分组,为啥sum()函数可以用呢?因为select在group by之后执行。 也就是说,sum函数执行的时候自动被分组,按照sal分组,并且求和,等到了select的时候,已经分组完毕了,就不会报错。
总结:顺序决定函数使用。
来,感受一些分组查询所能办到的事:
找出每个工作岗位的工资和?
翻译:按照每个工作岗位先分组,然后分别对相同的工作岗位求和工资。
select
job,sum(sal)
from
emp
group by
job;
以上这个语句的执行顺序?
1、先从emp表中查询数据。
2、根据job字段进行分组。
3、然后对每一组的数据进行sum(sal)
当使用分组函数的时候,select后面跟着的字段名有要求?
select ename,job,sum(sal) from emp group by job;
对job分组,却查询了跟job无关的ename?
我们的要求是,求不同部分的job的工资总和!SCOTT的薪资是6000?这完全是不对的,因此这么查询是没意义的!!
重点结论:在一条select语句当中,如果有group by语句的话,select后面只能跟:参加分组的字段,以及分组函数。其它的一律不能跟。
- 找出每个部门的最高薪资?
select deptno,max(sal) from emp group by deptno;
按照部门分组完,对不同的组,执行分组函数,求出组的结果。
- 找出“每个部门,不同工作岗位”的最高薪资?
技巧:两个字段联合成1个字段看。(两个字段联合分组)
select
deptno, job, max(sal)
from
emp
group by
deptno, job;
也就是说,将来分组的时候,可能是按照两个字段拼接一起,分组的。10CLERK为新的字段,类似于这种。
使用having可以对分完组之后的数据进一步过滤。
- 要求显示平均薪资高于2500的
第一步:找出每个部门平均薪资
select deptno,avg(sal) from emp group by deptno;
第二步:要求显示平均薪资高于2500的
select
deptno,avg(sal)
from
emp
group by
deptno
having
avg(sal) > 2500;
只需要对平均新薪资再次进行过滤,使用的是having关键字。
把查询结果去除重复记录【distinct】
注意:原表数据不会被修改 (这也是select语句的原则),只是查询结果去重。去重需要使用一个关键字:distinct
select distinct job from emp;
这样编写是错误的,语法错误: select ename,distinct job from emp;
distinct只能出现在所有字段的最前方。
distinct出现在job,deptno两个字段之前,表示两个字段联合起来去重。
select distinct job,deptno from emp;
可以看得出,job和deptno如果拼接起来,都是不重复的。
连接查询(非常重要:五颗星*****)
什么是连接查询?
从一张表中单独查询,称为单表查询。emp表和dept表联合起来查询数据,从emp表中取员工名字,从dept表中取部门名字。这种跨表查询,多张表联合起来查询数据,被称为连接查询。
连接查询的分类?
根据表连接的方式分类:
-
内连接:
1、等值连接
2、非等值连接
3、自连接 -
外连接:
1、左外连接(左连接)
2、右外连接(右连接)
当两张表进行连接查询时,没有任何条件的限制会发生什么现象?
首先,我们先看看这两张表都有哪些数据,都有多少行:
两张表连接没有任何条件限制:select ename,dname from emp, dept;
。from后面跟两个表,就表示两个表的连接查询。
可以看出:当两张表进行连接查询,没有任何条件限制的时候,最终查询结果条数,是两张表条数的乘积,这种现象被称为:笛卡尔积现象。也就是全连接查询了,也就是说emp表中的ename,会跟dept表中的每一个dname链接。
怎么避免笛卡尔积现象?
连接时加条件,只有满足这个条件的记录才会被筛选出来!
select
e.ename,d.dname
from
emp e, dept d
where
e.deptno = d.deptno;
上述语句的意思:当emp的deptno和dept的deptno相同时,才会把ename和dname查出来。
可以看出,在emp中的ename依据deptno跟dept的dname连接上了。这就叫表的链接!
思考:最终查询的结果条数是14条,但是匹配的过程中,匹配的次数减少了吗?
答案:还是56次,只不过进行了四选一,次数没有减少。(也就是说我都进行了匹配,只不过最后展现的是筛选之后的结果)
内连接之等值连接。
- 查询每个员工所在部门名称,显示员工名和部门名?
思路:emp e和dept d表进行连接。条件是:e.deptno = d.deptno
SQL92语法:
select
e.ename,d.dname
from
emp e, dept d
where
e.deptno = d.deptno;
sql92的缺点:结构不清晰,表的连接条件,和后期进一步筛选的条件,都放到了where后面。
因此,我们在进行表的连接的时候,使用的是SQL99的语法:from...join...on...
。from后面跟的是主表,join后面跟的是被连接的表,on后面跟的是连接条件。
SQL99语法:
select
e.ename,d.dname
from
emp e
inner join//内连接,inner可以省略,默认内连接
dept d
on
e.deptno = d.deptno;
sql99优点:表连接的条件是独立的,连接之后,如果还需要进一步筛选,再往后继续添加where
SQL99语法:
select
...
from
a
join
b
on
a和b的连接条件
where
筛选条件
内连接之非等值连接
- 找出每个员工的薪资等级,要求显示员工名、薪资、薪资等级?
先看看总表和薪资等级表是啥样?
我们的需求是:显示总表的ename,和sal,并且后面附上sal的薪资等级:
select
e.ename, e.sal, s.grade
from
emp e
join
salgrade s
on
e.sal between s.losal and s.hisal; // 条件不是一个等量关系,称为非等值连接。
这种,on后面的条件不是一个等量关系,而是范围关系,叫做非等值连接!
内连接之自连接
- 查询员工的上级领导,要求显示员工名和对应的领导名?
select empno,ename,mgr from emp;
需求是:员工编号对应着员工名字,每个员工既是员工,还可能是领导。我们要找出员工和其对应的领导名字。
技巧:一张表看成两张表。
emp a 员工表
emp b 领导表
select
a.ename as '员工名', b.ename as '领导名'
from
emp a//emp既是员工表
join
emp b//也是领导表
on
a.mgr = b.empno; //员工的领导编号 = 领导的员工编号
13条记录,没有KING。《内连接》。因为KING没有领导。
以上就是内连接中的:自连接,技巧:一张表看做两张表。
外连接
内连接:(A和B连接,AB两张表没有主次关系。平等的。)
select
e.ename,d.dname
from
emp e
join
dept d
on
e.deptno = d.deptno; //内连接的特点:完成能够匹配上这个条件的数据查询出来。
外连接家具不一样了。外连接会把其中一张表当做主表。主要是为了将这张表的数据全部查询出来,捎带着关联查询左边的表。(好好理解这句话!!!!!!)
在外连接当中,两张表连接,产生了主次关系。
那我想要查询主表,顺便把附表的东西查出来:就比如KING没有出现在上述案例中。
select
a.ename as '员工名', b.ename as '领导名'
from
emp a
left join//左连接的意思是,join左边的表为主表
emp b
on
a.mgr = b.empno;
可以看出,KING出现在了员工名中,但是领导名却是NULL的
三张表,四张表怎么连接?
select
...
from
a
join
b
on
a和b的连接条件
join
c
on
a和c的连接条件
right join//链接a和d的时候,以d为主表,因为是右连接,连接的是右边的
d
on
a和d的连接条件
一条SQL中内连接和外连接可以混合。都可以出现!
子查询
什么是子查询?select语句中嵌套select语句,被嵌套的select语句称为子查询。
子查询都可以出现在哪里呢?可以出现在很多地方:
select
..(select).
from
..(select).
where
..(select).
where子句中的子查询
- 找出比最低工资高的员工姓名和工资?
想要在where后面使用分组函数不正确。
select
ename,sal
from
emp
where
sal > min(sal);
ERROR 1111 (HY000): Invalid use of group function
where子句中不能直接使用分组函数。
还有什么解决办法吗?
第一步:查询最低工资是多少
可以看出,最低工资是800。
第二步:找出>800的:select ename,sal from emp where sal > 800;
第三步:合并 select ename,sal from emp where sal > (select min(sal) from emp);
where后面子查询的思想就是:利用查询到的数据作为一个中间变量,供where使用。
from子句中的子查询
注意:from后面的子查询,可以将子查询的查询结果当做一张临时表。(技巧)
- 找出每个岗位的平均工资的薪资等级。
第一步:找出每个岗位的平均工资(按照岗位分组求平均值)
select job,avg(sal) from emp group by job;
第二步:克服心理障碍,把以上的查询结果就当做一张真实存在的表t。
先把工资等级表定义为s表
t表和s表进行表连接,条件:t表avg(sal) between s.losal and s.hisal;
select
t.*, s.grade
from
(select job,avg(sal) as avgsal from emp group by job) t//子查询结果当做一个临时表
join
salgrade s
on
t.avgsal between s.losal and s.hisal;
可以看出,平均工资的等级,就出来了!!
union合并查询结果集
- 查询工作岗位是MANAGER和SALESMAN的员工?
经典做法:
select ename,job from emp where job = 'MANAGER' or job = 'SALESMAN';
select ename,job from emp where job in('MANAGER','SALESMAN');
union做法:
select ename,job from emp where job = 'MANAGER'
union
select ename,job from emp where job = 'SALESMAN';
limit查询(非常重要:五颗星*****)
limit作用:将查询结果集的一部分取出来。通常使用在分页查询当中。
百度默认:一页显示10条记录。
分页的作用是为了提高用户的体验,因为一次全部都查出来,用户体验差。可以一页一页翻页看。
limit怎么用呢?
完整用法:limit startIndex, length
startIndex是起始下标,length是长度。起始下标从0开始。
- 按照薪资降序,取出排名在前5名的员工?
select
ename,sal
from
emp
order by
sal desc
limit 0,5;
注意:mysql当中limit在order by之后执行!!!!!!也就是说,limit语句的执行顺序是最后执行。
DQL语句的大总结
select
...
from
...
where
...
group by
...
having
...
order by
...
limit
...
执行顺序?
1.from
2.where
3.group by
4.having
5.select
6.order by
7.limit..
表的创建(数据库中最小单元的创建)
建表的语法格式:(建表属于DDL语句,DDL包括:create drop alter)
create table 表名(
字段名1 数据类型,
字段名2 数据类型,
字段名3 数据类型
);
表名:建议以t_ 或者 tbl_开始,可读性强。见名知意。
字段名:见名知意。
表名和字段名都属于标识符。
MySQL中的数据类型
很多数据类型,我们只需要掌握一些常见的数据类型即可。
varchar(最长255)
可变长度的字符串
比较智能,节省空间。
会根据实际的数据长度动态分配空间。
优点:节省空间
缺点:需要动态分配空间,速度慢。
char(最长255)
定长字符串
不管实际的数据长度是多少。
分配固定长度的空间去存储数据。
使用不恰当的时候,可能会导致空间的浪费。
优点:不需要动态分配空间,速度快。
缺点:使用不当可能会导致空间的浪费。
varchar和char我们应该怎么选择?
性别字段你选什么?因为性别是固定长度的字符串,所以选择char。
姓名字段你选什么?每一个人的名字长度不同,所以选择varchar。
int(最长11)
数字中的整数型。等同于java的int。
bigint
数字中的长整型。等同于java中的long。
float
单精度浮点型数据
double
双精度浮点型数据
date
短日期类型
datetime
长日期类型
clob
字符大对象
最多可以存储4G的字符串。
比如:存储一篇文章,存储一个说明。
超过255个字符的都要采用CLOB字符大对象来存储。
Character Large OBject:CLOB
blob
二进制大对象
Binary Large OBject
专门用来存储图片、声音、视频等流媒体数据。
往BLOB类型的字段上插入数据的时候,例如插入一个图片、视频等,
你需要使用IO流才行。
创建一个学生表
学号、姓名、年龄、性别、邮箱地址
create table t_student(
no int,
name varchar(32),
sex char(1),
age int(3),
email varchar(255)
);
删除表:
drop table t_student;// 当这张表不存在的时候会报错!
drop table if exists t_student;// 如果这张表存在的话,删除
这样创建表,只是创建了一个表的框架,并没有具体数据。下面学习如何插入数据:
如何快速创建表(复制表)?
create table emp2 as select * from emp;
原理:将一个查询结果当做一张表新建!!!!!
这个可以完成表的快速复制!!!!表创建出来,同时表中的数据也存在了!!!
插入数据insert (DML语句)
语法格式:
insert into 表名(字段名1,字段名2,字段名3...) values(值1,值2,值3);
注意:字段名和值要一一对应。什么是一一对应?数量要对应。数据类型要对应。
insert into t_student(no,name,sex,age,email) values(1,'zhangsan','m',20,'zhangsan@123.com');
insert into t_student(email,name,sex,age,no) values('lisi@123.com','lisi','f',20,2);
//顺序不对无所谓,但是要对应
这样就创建了一个表,并插入了数据。
insert语句可以一次插入多条记录吗?
答案是:可以的!
insert into t_student(no,name,sex,age,email) values
(1,'zhangsan','m',20,'zhangsan@123.com');
(2,'zhangsan','m',20,'zhangsan@123.com');
(3,'zhangsan','m',20,'zhangsan@123.com');
(4,'zhangsan','m',20,'zhangsan@123.com');
修改表中数据update(DML语句)
语法格式:
update 表名 set 字段名1=值1, 字段名2=值2, 字段名3=值3... where 条件;
注意:没有条件限制会导致所有数据全部更新。
更新no=2的那一行:update t_student set name = 'jack', sex= 'm' where no = 2;
可以看到,我就更新了name和sex,其他没更新,就不会变。
如果我没有设置where,就会全部行更新name和sex。如下:
删除数据delete (DML语句)
语法格式?
delete from 表名 where 条件;
注意:没有条件,整张表的数据会全部删除!
delete from t_student where no = 2;
可以看到,no=2的那一行被删掉了
如果不加条件,整个表全部被删除:
delete from t_student ;
快速删除表中的数据?truncate方法
delete from t_student;
//这种删除数据的方式比较慢。
truncate table dept_bak;
//这种删除数据的方式比较快。
truncate语句删除数据的原理?
1、这种删除效率比较高,表被一次截断,物理删除。
2、这种删除缺点:不支持回滚。
3、这种删除优点:快速。
应用场景: 大表非常大,上亿条记录!!!!!
删除的时候,使用delete,也许需要执行1个小时才能删除完!效率较低。
可以选择使用truncate删除表中的数据。只需要不到1秒钟的时间就删除结束。效率较高。
但是使用truncate之前,必须仔细询问客户是否真的要删除,并警告删除之后不可恢复!
truncate是删除表中的数据,表还在!
删除表操作?drop table 表名;
// 这不是删除表中的数据,这是把表删除。
约束(非常重要,五颗星*****)
什么是约束?
约束对应的英语单词:constraint
在创建表的时候,我们可以给表中的字段加上一些约束,来保证这个表中数据的完整性、有效性!!!
约束的作用就是为了保证:表中的数据有效!!
约束包括哪些
- 非空约束:not null
- 唯一性约束: unique
- 主键约束: primary key (简称PK)
- 外键约束:foreign key(简称FK)
非空约束:not null
非空约束not null约束的字段不能为NULL。
我们首先创建一个t_vip表,并且约束name字段不能为空,也就是说将来的name中的数据不能为空
drop table if exists t_vip;
create table t_vip(
id int,
name varchar(255) not null // not null只有列级约束,没有表级约束!
);
插入两条数据:
insert into t_vip(id,name) values(1,'zhangsan');
insert into t_vip(id,name) values(2,'lisi');
当我想要在name字段插入一个null时,报错!!
insert into t_vip(id) values(3);
唯一性约束: unique
唯一性约束unique约束的字段不能重复,但是可以为NULL。
我对name字段进行了唯一性约束,因此不可以插入重复的数据。
新需求:name和email两个字段联合起来具有唯一性!!!!
也就意味着,名字可以重复,但是名字和邮箱加起来不重复就可以,怎么实现呢?
drop table if exists t_vip;
create table t_vip(
id int,
name varchar(255),
email varchar(255),
unique(name,email) // 约束没有添加在列的后面,这种约束被称为表级约束。
);
这种约束没有添加在某一个字段的后面,而是单独一个,这种约束被叫做表级约束。
可以看到,name虽然重了,但是联合email就是不重复的。
主键约束(primary key,简称PK,非常重要:五颗星*****)
主键约束的相关术语?
主键约束:就是一种约束。
主键字段:该字段上添加了主键约束,这样的字段叫做:主键字段
主键值:主键字段中的每一个值都叫做:主键值。
什么是主键?有啥用?
主键值是每一行记录的唯一标识。相当于:主键值是每一行记录的身份证号!!!
记住:任何一张表都应该有主键,没有主键,表无效!!
主键的特征:
not null + unique(主键值不能是NULL,同时也不能重复!)
怎么给一张表添加主键约束呢?
drop table if exists t_vip;
create table t_vip(
id int primary key,
name varchar(255)
);
insert into t_vip(id,name) values(1,'zhangsan');
insert into t_vip(id,name) values(2,'lisi');
insert into t_vip(id,name) values(2,'wangwu');//错误:主键不能重复
ERROR 1062 (23000): Duplicate entry '2' for key 'PRIMARY'
当我为id字段设置为主键之后,就不能重复了。
一个表中主键约束能加两个吗?
drop table if exists t_vip;
create table t_vip(
id int primary key,
name varchar(255) primary key
);
ERROR 1068 (42000): Multiple primary key defined
结论:一张表,主键约束只能添加1个。(主键只能有1个。)
答案是:一个表中,主键约束只能有一个!!!
在mysql当中,有一种机制,可以帮助我们自动维护一个主键值
drop table if exists t_vip;
create table t_vip(
id int primary key auto_increment, //auto_increment表示自增,从1开始,以1递增!
name varchar(255)
);
insert into t_vip(name) values('zhangsan');
insert into t_vip(name) values('zhangsan');
insert into t_vip(name) values('zhangsan');
insert into t_vip(name) values('zhangsan');
insert into t_vip(name) values('zhangsan');
insert into t_vip(name) values('zhangsan');
insert into t_vip(name) values('zhangsan');
insert into t_vip(name) values('zhangsan');
select * from t_vip;
我们为id维护了一个自增属性,就像等于id被添加了主键约束
外键约束(foreign key,简称FK,非常重要:五颗星*****)
外键约束涉及到的相关术语:
外键约束:一种约束(foreign key)
外键字段:该字段上添加了外键约束
外键值:外键字段当中的每一个值。
业务背景:请设计数据库表,来描述“班级和学生”的信息?
- 第一种方案:班级和学生存储在一张表中???
分析以上方案的缺点:数据冗余,空间浪费!!!这个设计是比较失败的!
- 第二种方案:班级一张表、学生一张表
这样的话,学生表就可以使用班级编号与引用班级表的班级编号,这样就避免了数据冗余!学生表中的cno就被添加了外键约束!
当cno字段没有任何约束的时候,可能会导致数据无效。可能出现一个102,但是102班级不存在。
所以为了保证cno字段中的值都是100和101,需要给cno字段添加外键约束。
那么:cno字段就是外键字段。cno字段中的每一个值都是外键值。
存储引擎
什么是存储引擎,有什么用呢?
存储引擎是MySQL中特有的一个术语,其它数据库中没有。(Oracle中有,但是不叫这个名字)
存储引擎这个名字高端大气上档次。实际上存储引擎是一个表存储/组织数据的方式。
不同的存储引擎,表存储数据的方式不同。
MySQL常用的存储引擎介绍一下
- MyISAM存储引擎
它管理的表具有以下特征:使用三个文件表示每个表:
格式文件 — 存储表结构的定义(mytable.frm)
数据文件 — 存储表行的内容(mytable.MYD)
索引文件 — 存储表上索引(mytable.MYI):索引是一本书的目录,缩小扫描范围,提高查询效率的一种机制。
MyISAM存储引擎特点:
可被转换为压缩、只读表来节省空间
这是这种存储引擎的优势!!!! MyISAM不支持事务机制,安全性低。
- InnoDB存储引擎
这是mysql默认的存储引擎,同时也是一个重量级的存储引擎。
InnoDB支持事务,支持数据库崩溃后自动恢复机制。
InnoDB存储引擎最主要的特点是:非常安全。
- MEMORY存储引擎
使用 MEMORY 存储引擎的表,其数据存储在内存中,且行的长度固定,这两个特点使得 MEMORY 存储引擎非常快。
MEMORY引擎优点:查询效率是最高的。不需要和硬盘交互。
MEMORY引擎缺点:不安全,关机之后数据消失。因为数据和索引都是在内存当中。
事务(重点:五颗星*****,必须理解,必须掌握)
什么是事务?
一个事务其实就是一个完整的业务逻辑。是一个最小的工作单元。不可再分。
什么是一个完整的业务逻辑?
假设转账,从A账户向B账户中转账10000.
将A账户的钱减去10000(update语句)
将B账户的钱加上10000(update语句)
上述一个简单的过程,就是一个完整的业务逻辑。
以上的操作是一个最小的工作单元,要么同时成功,要么同时失败,不可再分。这两个update语句要求必须同时成功或者同时失败,这样才能保证钱是正确的。
只有DML语句才会有事务这一说,其它语句和事务无关!!!
insert
delete
update
只有以上的三个语句和事务有关系,其它都没有关系。
因为 只有以上的三个语句是数据库表中数据进行增、删、改的。只要你的操作一旦涉及到数据的增、删、改,那么就一定要考虑安全问题。数据安全第一位!!!
假设所有的业务,只要一条DML语句就能完成,还有必要存在事务机制吗?
正是因为做某件事的时候,需要多条DML语句共同联合起来才能完成,所以需要事务的存在(因为多条DML语句同时做事情,总有不老实的,可能执行失败的。因此,才要避免这样的事发生,防止一个老鼠坏了一锅汤)。如果任何一件复杂的事儿都能一条DML语句搞定,那么事务则没有存在的价值了。
到底什么是事务呢?对事务的理解是什么呢?
说到底,说到本质上,一个事务其实就是:多条DML语句同时成功,或者同时失败!
事务:就是批量的DML语句同时成功,或者同时失败!
事务是怎么做到多条DML语句同时成功和同时失败的呢?
InnoDB存储引擎:提供一组用来记录事务性活动的日志文件。
大致的过程如下:
事务开启了:
insert
insert
insert
delete
......
update
update
update
事务结束了!
在事务的执行过程中,每一条DML的操作都会记录到“事务性活动的日志文件”中。在事务的执行过程中,我们可以提交事务,也可以回滚事务。
提交事务?
清空事务性活动的日志文件,将数据全部彻底持久化到数据库表中。提交事务标志着,事务的结束。并且是一种全部成功的结束。
回滚事务?
将之前所有的DML操作全部撤销,并且清空事务性活动的日志文件回滚事务标志着,事务的结束。并且是一种全部失败的结束。
都会清空日志文件,但是一个是清空之后把数据写在数据库中,一个是清空之后把数据撤回。
回答标题的问题:事务是怎么做到多条DML语句同时成功和同时失败的呢?
答案:如果不同时成功,我就不提交,我就回滚,可以做到DML语句的同时失败!如果成功了,我就全部提交,可以做到DML语句的同时成功!!
怎么提交事务,怎么回滚事务?
提交事务:commit;
语句(mysql默认情况下是支持自动提交事务的,什么是自动提交?每执行一条DML语句,则提交一次!)
这种自动提交实际上是不符合我们的开发习惯,因为一个业务通常是需要多条DML语句共同执行才能完成的,为了保证数据的安全,必须要求同时成功之后再提交,所以不能执行一条就提交一条。
回滚事务:rollback;
语句(回滚永远都是只能回滚到上一次的提交点!)
事务对应的英语单词是:transaction
怎么将mysql的自动提交机制关闭掉呢?
先执行这个命令:start transaction;
意味着,我要开启事物了!!!
我们先来演示一下回滚事务:
可以看到,在我们开启事务之后,自动提交就被关闭了(插入不是提交,只是先插入,还没按下确定键的那种)。我使用回滚事务命令rollback
,可以撤销插入的数据。
现在我们演示一下,提交事务:
总结:DML语句只是暂时改变标准的数据,真正拍板的,还是提交事务commit语句。如果没有commit,rollback还有回旋的余地,如果commit了,rollback就不可撤销刚才的操作了。
事务的4个特性
-
A:原子性
说明事务是最小的工作单元。不可再分。 -
C:一致性
所有事务要求,在同一个事务当中,所有操作必须同时成功,或者同时失败,以保证数据的一致性。 -
I:隔离性
A事务和B事务之间具有一定的隔离。
教室A和教室B之间有一道墙,这道墙就是隔离性。 -
D:持久性
事务最终结束的一个保障。事务提交,就相当于将没有保存到硬盘上的数据保存到硬盘上!
重点研究一下事务的隔离性
A教室和B教室中间有一道墙,这道墙可以很厚,也可以很薄。这就是事务的隔离级别。这道墙越厚,表示隔离级别就越高。
事务和事务之间的隔离级别有哪些呢?4个级别:
- 读未提交:read uncommitted(最低的隔离级别)《没有提交就读到了》
什么是读未提交? 事务A可以读取到事务B未提交的数据。
这种隔离级别存在的问题就是:脏读现象!(Dirty Read)我们称读到了脏数据。
这种隔离级别一般都是理论上的,大多数的数据库隔离级别都是二档起步!
- 读已提交:read committed《提交之后才能读到》
什么是读已提交? 事务A只能读取到事务B提交之后的数据。
这种隔离级别解决了什么问题? 解决了脏读的现象。
这种隔离级别存在什么问题? 不可重复读取数据。
什么是不可重复读取数据呢?在事务开启之后,第一次读到的数据是3条。假如当前事务还没有结束,可能第二次再读取的时候,读到的数据是4条,3不等于4称为不可重复读取。这种级别,可以实现读取最新的数据。
- 可重复读:repeatable read《提交之后也读不到,永远读取的都是刚开启事务时的数据》
什么是可重复读取? 事务A开启之后,不管是多久,每一次在事务A中读取到的数据都是一致的。即使事务B将数据已经修改,并且提交了,事务A读取到的数据还是没有发生改变,这就是可重复读。这种级别,可以实现事务A始终读取的是第一开始的数据,即使后续被更改了,我读的永远都是我第一次读的数据。
可重复读解决了什么问题? 解决了不可重复读取数据。
可重复读存在的问题是什么? 可以会出现幻影读。每一次读取到的数据都是幻象。不够真实!也就是说,这种级别读到的数据并不是当前数据库中最新的数据。
- 序列化/串行化:serializable(最高的隔离级别)
这是最高隔离级别,效率最低。解决了所有的问题。这种隔离级别表示事务排队,不能并发!synchronized,线程同步(事务同步)。每一次读取到的数据都是最真实的,并且效率是最低的。
以上四种级别,都有其用武之地!!不是说我们以后只用最高隔离级别的事务,要根据业务需求而定!!!
索引(index,非常重要:五颗星*****)
什么是索引?
索引是在数据库表的字段上添加的,是为了提高查询效率存在的一种机制。一张表的一个字段可以添加一个索引,当然,多个字段联合起来也可以添加索引。索引相当于一本书的目录,是为了缩小扫描范围而存在的一种机制。
比如我想要查询name=jack的数据,select * from t_user where name = 'jack';
如果name字段上没有添加索引(目录),或者说没有给name字段创建索引,MySQL会进行全扫描,会将name字段上的每一个值都比对一遍,效率比较低。
MySQL在查询方面主要就是两种方式:
-
第一种方式:全表扫描
-
第二种方式:根据索引检索。
我们知道了全表扫描效率低,所以我们尽量在有需要的时候,为字段添加索引。
假设,我们为name字段添加了索引,那么查找的时候是怎么查找的呢?
索引,会把name字段中的所有数据存在B-Tree(二叉树的一种,是一种极度平衡的二叉搜素树)里,然后查询的时候,效率就是二叉树的查询效率,就很快!!
这就是索引!!!这就是MySQL中的索引,本质就是B-Tree实现的数据存储方式而已。非常的简单!!!
在任何数据库当中主键上都会自动添加索引对象(unique约束的字段也会被自动添加索引)
主键会被自动添加索引!!!id字段上自动有索引,因为id是PK。另外在mysql当中,一个字段上如果有unique约束的话,也会自动创建索引对象。
什么条件下,我们会考虑给字段添加索引呢?
-
条件1:数据量庞大(到底有多么庞大算庞大,这个需要测试,因为每一个硬件环境不同)
-
条件2:该字段经常出现在where的后面,以条件的形式存在,也就是说这个字段总是被扫描。
-
条件3:该字段很少的DML(insert delete update)操作。(因为DML之后,索引需要重新排序。)
建议不要随意添加索引,因为索引也是需要维护的,太多的话反而会降低系统的性能。建议通过主键查询,建议通过unique约束的字段进行查询,效率是比较高的。
在任何数据库当中,任何一张表的任何一条记录在硬盘存储上都有一个硬盘的物理存储编号。
索引怎么创建?怎么删除?语法是什么?
创建索引:create index
是关键字!!!
create index emp_ename_index on emp(ename);
给emp表的ename字段添加索引,起名:emp_ename_index
删除索引:drop index
是关键字!!!
drop index emp_ename_index on emp;
将emp表上的emp_ename_index索引对象删除。
索引有失效的时候,什么时候索引失效呢?
- 失效的第1种情况:
select * from emp where ename like '%T';
ename上即使添加了索引,也不会走索引,为什么?原因是因为模糊匹配当中以“%”开头了!尽量避免模糊查询的时候以“%”开始。这是一种优化的手段/策略。
-
失效的第2种情况:使用or的时候会失效,如果使用or那么要求or两边的条件字段都要有索引,才会走索引。
-
失效的第3种情况:使用复合索引的时候,没有使用左侧的列查找,索引失效什么是复合索引?两个字段,或者更多的字段联合起来添加一个索引,叫做复合索引。
-
失效的第4种情况:在where当中索引列参加了运算,索引失效。
-
失效的第5种情况:在where当中索引列使用了函数
视图(view)
什么是视图?
view:站在不同的角度去看待同一份数据。
怎么创建视图对象?怎么删除视图对象?
创建视图对象:create view dept2_view as select * from dept2;
as后面就是一个查询到的表,用视图引用这个select语句查询到的表!!!
删除视图对象:drop view dept2_view;
用视图做什么?
我们可以面向视图对象进行增删改查,对视图对象的增删改查,会导致原表被操作!(视图的特点:通过对视图的操作,会影响到原表数据。)
说白话:视图view
相当于原表的引用!!!
视图对象在实际开发中到底有什么用?《方便,简化开发,利于维护》
假设有一条非常复杂的SQL语句,而这条SQL语句需要在不同的位置上反复使用。
select
e.ename,e.sal,d.dname
from
emp e
join
dept d
on
e.deptno = d.deptno;
...
这个select查到的表,在很多地方都会被使用。这时候,我可以使用视图来引用一下这个非常长的SQL语句查到的表!!!
create view
emp_dept_view
as
select
e.ename,e.sal,d.dname
from
emp e
join
dept d
on
e.deptno = d.deptno;
在需要编写这条SQL语句的位置直接使用视图对象,可以大大简化开发。并且利于后期的维护,因为修改的时候也只需要修改一个位置就行,只需要修改视图对象所映射的SQL语句。
数据库设计三范式
什么是数据库设计范式?
数据库表的设计依据。教你怎么进行数据库表的设计。也就是说,怎么设计数据库最规范,后期维护更便捷!!!
第一范式
最核心,最重要的范式,所有表的设计都需要满足。
那就是:必须有主键,并且每一个字段都是原子性不可再分。
以上是学生表,满足第一范式吗?
不满足,第一:没有主键。第二:联系方式不具备原子性,因为联系方式可以分为邮箱地址和电话
所以,需要把这个表设计成如下形式:
第二范式
建立在第一范式的基础之上,要求所有非主键字段必须完全依赖主键,不要产生部分依赖。
这张表描述了学生和老师的关系:(1个学生可能有多个老师,1个老师有多个学生)
这是非常典型的:多对多关系!
分析以上的表是否满足第一范式?答案:不满足第一范式。
修改:学生编号 教师编号,两个字段联合做主键,复合主键(PK: 学生编号+教师编号)
经过修改之后,以上的表满足了第一范式。但是满足第二范式吗?
不满足,“张三”依赖1001,“王老师”依赖001,显然产生了部分依赖。
产生部分依赖有什么缺点? 数据冗余了。空间浪费了。“张三”重复了,“王老师”重复了。
为了让以上的表满足第二范式,你需要这样设计:使用三张表来表示多对多的关系!!!!
关系表中两个编号使用外键约束,引用学生表和教师表的编号。这样就避免了张三、王老师这种数据的重复
背口诀:多对多怎么设计?多对多,三张表,关系表两个外键!!!!!!!
第三范式
第三范式建立在第二范式的基础之上:要求所有非主键字典必须直接依赖主键,不要产生传递依赖。
比如下面的表:
分析以上表是否满足第一范式? 满足第一范式,有主键。
分析以上表是否满足第二范式? 满足第二范式,因为主键不是复合主键,没有产生部分依赖。主键是单一主键。
分析以上表是否满足第三范式? 第三范式要求:不要产生传递依赖!一年一班依赖01,01依赖1001,产生了传递依赖。不符合第三范式的要求。产生了数据的冗余。
那么应该怎么设计一对多呢?
背口诀:一对多,两张表,多的表加外键!!!!!!!!!!!!
嘱咐一句话:
数据库设计三范式是理论上的。
实践和理论有的时候有偏差。
最终的目的都是为了满足客户的需求,有的时候会拿冗余换执行速度。
因为在sql当中,表和表之间连接次数越多,效率越低。(笛卡尔积)
有的时候可能会存在冗余,但是为了减少表的连接次数,这样做也是合理的,
并且对于开发人员来说,sql语句的编写难度也会降低。
面试的时候把这句话说上:他就不会认为你是初级程序员了!