目录
一、索引
1.概述
2.作用
3.索引的缺点
4.创建索引的原则依据
5.索引分类和创建
5.1普通索引
5.2唯一索引
5.3主键索引
5.4组合索引(单列索引与多列索引)
5.5全文索引(FULLTEXT)
6.查看索引
7.删除索引
二、事务
1.概念
2.事务的ACID特点
2.1原子性
2.2一致性
2.3隔离性
2.4持久性
3.事务的隔离级别
3.1一致性问题
3.2隔离级别
4.设置隔离级别命令
4.1查询全局事务隔离级别
4.2查询会话事务隔离级别
4.3设置全局事务隔离级别
4.4设置会话事务隔离级别
5.事务控制语句
5.1创建新数据表
5.2测试提交事务
5.3测试回滚事务
5.4测试多点回滚
6. 使用set设置控制事务
三、mysql存储引擎
1.概念
2.常用的存储引擎
2.1MyISAM特点
2.2MyISAM适用的生产场景
2.3InnoDB特点
2.4InnoDB适用的生产场景
3.MyISAM表支持的不同存储格式
3.1静态(固定长度)表
3.2动态表
3.3压缩表
4. 存储引擎相关命令
4.1查看系统支持的存储引擎
4.2查看表使用的存储引擎
4.3修改存储引擎
5.InnoDB行锁与索引的关系
6.死锁
6.1案例演示
6.2如何尽可能避免死锁
6.3for update
一、索引
1.概述
- 索引是一个排序的列表,在这个列表中存储着索引的值和包含这个值的数据所在行的物理地址
- 使用索引后可以不用扫描全表来定位某行的数据,而是通过索引表找到该行数对应的物理地址然后访问相应的数据
- 索引好比是一本书的目录,可以根据目录中的页码快速找到所需的内容
- 索引是表中一列或者若干列值排序的方法
- 建立索引的目的是加快对表中记录的查找或排序
2.作用
- 设置了合适的索引之后,数据库利用各种快速定位技术,能够大大加快查询速度,这是创建索引的最主要原因
- 当表很大或查询涉及到多个表时,使用索引可以成千上万倍地提高查询速度
- 可以降低数据库的IO成本,并且索引还可以降低数据库的排序成本
- 通过创建唯一性索引,可以保证数据表中每一行数据的唯一性
- 可以加快表与表之间的连接
- 在使用分组和排序时,可大大减少分组和排序的时间
- 建立索引在搜索和恢复数据库中的数据时能显著提高性能
3.索引的缺点
- 索引需要占用额外的磁盘空间(对于MyISAM引擎而言,索引文件和数据文件是分离的,索引文件用于保存数据记录的地址;而InnoDB引擎的表数据文件本身就是索引文件)
- 更新一个包含索引的表需要比更新一个没有索引的表花费更多的时间,这是由于索引本身也需要更新。因此在,理想的做法是仅仅在常常被搜索到的列(以及表)上面创建索引
4.创建索引的原则依据
索引虽可以提升数据库查询的数据,但并不是任何情况下都适合创建索引。因为索引本身会消耗系统资源,在有索引的情况下,数据库会先进行索引查询,然后定位到具体的数据行,如果索引使用不当,反而会增加数据库的负担
- 表的主键,外键必须有索引。因为主键具有唯一性,外键关联的是主表的主键,查询时可以快速定位
- 记录数超过300行的表应该有索引。如果没有索引,每次查询都需要把表遍历一遍,会严重影响数据库的性能
- 经常与其他表进行连接的表,在连接字段上应该建立索引
- 唯一性太差的字段不适合建立索引
- 更新太频繁地字段不适合创建索引
- 经常出现在where子句中的字段,特别是大表的字段,应该建立索引
- 在经常进行GROUP BY、ORDER BY的字段上建立索引
- 索引应该建在选择性高的字段上
- 索引应该建在小字段上,对于大的文本字段甚至超长字段,不要建索引
5.索引分类和创建
5.1普通索引
最基本的索引类型,没有唯一性之类的限制。
create index 索引名 on 表名 (字段);
alter table 表名 add index 索引名 (字段);
5.2唯一索引
与普通索引类似,但区别是唯一索引列的每个值都唯一。唯一索引允许有空值(注意和主键不同)。如果是用组合索引创建,则列值的组合必须唯一。添加唯一键将自动创建唯一索引。
create unique index 索引名 on 表名 (字段);
alter table 表名 add unique 索引名 (字段);
5.3主键索引
是一种特殊的唯一索引,必须指定为“PRIMARY KEY”。一个表只能有一个主键,不允许有空值。 添加主键将自动创建主键索引。
alter table 表名 add primary key (字段);
5.4组合索引(单列索引与多列索引)
可以是单列上创建的索引,也可以是在多列上创建的索引。需要满足最左原则,因为 select 语句的 where 条件是依次从左往右执行的,所以在使用 select 语句查询时 where 条件使用的字段顺序必须和组合索引中的排序一致,否则索引将不会生效。
create unique index 索引名 on 表名 (字段1, 字段2, 字段3);
alter table 表名 add index 索引名 (字段1, 字段2, 字段3);
select ... from 表名 where 字段1=XX and 字段2=xx and 字段3=XX
用 and 做条件逻辑运算符时,要创建组合索引且要满足最左原则
select ... from 表名 where 字段1=XX or 字段2=xx or 字段3=XX
用 or 做条件逻辑运算符时,所有字段都要创建索引
5.5全文索引(FULLTEXT)
适合在进行模糊查询的时候使用,可用于在一篇文章中检索文本信息。在 MySQL5.6 版本以前
FULLTEXT 索引仅可用于 MyISAM 引擎,在 5.6 版本之后 innodb 引擎也支持 FULLTEXT 索引。全文索引可以在 CHAR、VARCHAR 或者 TEXT 类型的列上创建。
create fulltext index 索引名 on 表名 (字段);
alter table 表名 add fulltext 索引名 (字段);
模糊查询: select ... from 表名 where match(字段) against('查询内容');
6.查看索引
show create table 表名;
show index from 表名;
show keys from 表名;
7.删除索引
drop index 索引名 on 表名;
alter table 表名 drop 索引名;
alter table 表名 drop primary key;
二、事务
1.概念
事务,它是一个操作序列,这些操作要么都执行,要么都不执行,它是一个不可分割的工作单位。
- 事务是一种机制、一个操作序列,包含了一组数据库操作命令,并且把所有的命令作为一个整体一起向系统提交或撤销操作请求,即这一组数据库命令要么都执行,要么都不执行。
- 事务是一个不可分割的工作逻辑单元,在数据库系统上执行并发操作时,事务是最小的控制单元。事务适用于多用户同时操作的数据库系统的场景,如银行、保险公司及证券交易系统等等。
- 事务通过事务的整体性以保证数据的一致性。
- 事务能够提高在向表中更新和插入信息期间的可靠性。
2.事务的ACID特点
ACID,是指在可靠数据库管理系统(DBMS)中,事务(transaction)应该具有的四个特性:原子性(Atomicity)、一致性(Consistency)、隔离性(Isolation)、持久性(Durability)。这是可靠数据库所应具备的几个特性。
在事务管理中,原子性是基础,隔离性是手段,一致性是目的,持久性是结果。
2.1原子性
- 指事务是一个不可再分割的工作单位,事务中的操作要么都发生,要么都不发生。
- 事务是一个完整的操作,事务的各元素是不可分的。
- 事务中的所有元素必须作为一个整体提交或回滚。
- 如果事务中的任何元素失败,则整个事务将失败。
案例:A给B转帐100元钱的时候只执行了扣款语句,就提交了,此时如果突然断电,A账号已经发生了扣款,B账号却没收到加款,在生活中就会引起纠纷。这种情况就需要事务的原子性来保证事务要么都执行,要么就都不执行。
2.2一致性
- 指在事务开始之前和事务结束以后,数据库的完整性约束没有被破坏。
- 当事务完成时,数据必须处于一致状态。
- 在事务开始前,数据库中存储的数据处于一致状态。
- 在正在进行的事务中,数据可能处于不一致的状态。
- 当事务成功完成时,数据必须再次回到已知的一致状态。
案例: 对银行转帐事务,不管事务成功还是失败,应该保证事务结束后表中A和B的存款总额跟事务执行前一致。
2.3隔离性
- 指在并发环境中,当不同的事务同时操纵相同的数据时,每个事务都有各自的完整数据空间。
- 对数据进行修改的所有并发事务是彼此隔离的,表明事务必须是独立的,它不应以任何方式依赖于或影响其他事务。
- 修改数据的事务可在另一个使用相同数据的事务开始之前访问这些数据,或者在另一个使用相同数据的事务结束之后访问这些数据。
- 也就是说并发访问数据库时,一个用户的事务不被其他事务所干扰,各并发事务之间数据库是独立的。
2.4持久性
- 持久性:在事务完成以后,该事务所对数据库所作的更改便持久的保存在数据库之中,并不会被回滚。
- 指不管系统是否发生故障,事务处理的结果都是永久的。
- 一旦事务被提交,事务的效果会被永久地保留在数据库中。
3.事务的隔离级别
3.1一致性问题
当多个客户端并发地访问同一个表时,可能出现下面的一致性问题:
- 脏读:当一个事务正在访问数据,并且对数据进行了修改,而这种修改还没有提交到数据库中,这时,另外一个事务也访问这个数据,然后使用了这个数据。
- 不可重复读:指在一个事务内,多次读同一数据。在这个事务还没有结束时,另外一个事务也访问该同一数据。那么,在第一个事务中的两次读数据之间,由于第二个事务的修改,那么第一个事务两次读到的的数据可能是不一样的。这样就发生了在一个事务内两次读到的数据是不一样的,因此称为是不可重复读。(即不能读到相同的数据内容)
- 幻读:一个事务对一个表中的数据进行了修改,这种修改涉及到表中的全部数据行。同时,另一个事务也修改这个表中的数据,这种修改是向表中插入一行新数据。那么,操作前一个事务的用户会发现表中还有一个没有修改的数据行,就好象发生了幻觉一样。
- 丢失更新:两个事务同时读取同一条记录,A先修改记录,B也修改记录(B不知道A修改过),B提交数据后B的修改结果覆盖了A的修改结果。
3.2隔离级别
MySQL事务支持如下四种隔离,用以控制事务所做的修改,并将修改通告至其它并发的事务:
- 未提交读(Read Uncommitted(RU)):允许脏读,不可重复读,幻读。即允许一个事务可以看到其他事务未提交的修改。
- 提交读(Read Committed(RC)):允许一个事务只能看到其他事务已经提交的修改,未提交的修改是不可见的。防止脏读。允许不可重复读,幻读。
- 可重复读(Repeatable Read(RR)):---mysql默认的隔离级别确保如果在一个事务中执行两次相同的SELECT语句,都能得到相同的结果,不管其他事务是否提交这些修改。可以防止脏读和不可重复读。有条件的运行(innodb不允许)幻读。
- 串行读(Serializable):---相当于锁表。完全串行化的读,将一个事务与其他事务完全地隔离。每次读都需要获得表级共享锁,读写相互都会阻塞。可以防止脏读,不可重复读取和幻读,(事务串行化)会降低数据库的效率。
mysql默认的事务处理级别是 repeatable read ,而Oracle和SQL Server是 read committed 。
4.设置隔离级别命令
事务隔离级别的作用范围分为两种:
- 全局级:对所有的会话有效
- 会话级:只对当前的会话有效
4.1查询全局事务隔离级别
show global variables like '%isolation%';
SELECT @@global.tx_isolation;
4.2查询会话事务隔离级别
show session variables like '%isolation%';
SELECT @@session.tx_isolation;
SELECT @@tx_isolation;
4.3设置全局事务隔离级别
set global transaction isolation level read committed;
set @@global.tx_isolation='read-committed'; #重启服务后失效
4.4设置会话事务隔离级别
set session transaction isolation level repeatable read;
set @@session.tx_isolation='repeatable-read';
5.事务控制语句
- BEGIN 或 START TRANSACTION:显式地开启一个事务。
- COMMIT 或 COMMIT WORK:提交事务,并使已对数据库进行的所有修改变为永久性的。
- ROLLBACK 或 ROLLBACK WORK:回滚会结束用户的事务,并撤销正在进行的所有未提交的修改。
- SAVEPOINT S1:使用 SAVEPOINT 允许在事务中创建一个回滚点,一个事务中可以有多个 SAVEPOINT;“S1”代表回滚点名称。
- ROLLBACK TO [SAVEPOINT] S1:把事务回滚到标记点。
5.1创建新数据表
create table account(
id int(10) primary key not null,
name varchar(40),
money double
);
#在表中插入数据
insert into account values(1,'A',1000);
insert into account values(2,'B',1000);
5.2测试提交事务
begin;
update account set money= money - 100 where name='A';
commit;
select * from account;
5.3测试回滚事务
begin;
update account set money= money + 100 where name='A';
rollback;
select * from account;
5.4测试多点回滚
begin;
update account set money= money + 100 where name='A';
SAVEPOINT S1;
update account set money= money + 100 where name='B';
SAVEPOINT S2;
insert into account values(3,'C',1000);
select * from account;
ROLLBACK TO S1;
select * from account;
6. 使用set设置控制事务
- 如果没有开启自动提交,当前会话连接的mysql的所有操作都会当成一个事务直到你输入rollback|commit;当前事务才算结束。当前事务结束前新的mysql连接时无法读取到任何当前会话的操作结果。
- 如果开起了自动提交,mysql会把每个sql语句当成一个事务,然后自动的commit。
- 当然无论开启与否,begin; commit|rollback; 都是独立的事务。
SET AUTOCOMMIT=0; #禁止自动提交
SET AUTOCOMMIT=1; #开启自动提交,Mysql默认为1
SHOW VARIABLES LIKE 'AUTOCOMMIT'; #查看Mysql中的AUTOCOMMIT值
三、mysql存储引擎
1.概念
- MySQL中的数据用各种不同的技术存储在文件中,每一种技术都使用不同的存储机制、索引技巧、锁定水平并最终提供不同的功能和能力,这些不同的技术以及配套的功能在MySQL中称为存储引擎。
- 存储引擎是MySQL将数据存储在文件系统中的存储方式或者存储格式
- MySQL数据库中的组件,负责执行实际的数据I/O操作
- MySQL系统中,存储引擎处于文件系统之上,在数据保存到数据文件之前会传输到存储引擎,之后按照各个存储引擎的存储格式进行存储。
2.常用的存储引擎
2.1MyISAM特点
- 不支持事务和外键约束,占用资源较小,访问速度快,表级锁定,支持全文索引,适用于不需要事务处理,单独写入或查询的应用场景。
- 访问速度快,对事务完整性没有要求
- MyISAM适合查询、插入为主的应用
- MyISAM在磁盘上存储成三个文件,文件名和表名都相同,但扩展名分别为:.fm(文件存储表结构的定义),.MYD(MYData 数据文件的扩展名),.MYI(MYIndex 索引文件的扩展名)
- 表级锁定形式,数据在更新时锁定整个表
- 数据库在读写过程中相互阻塞,会在数据写入的过程阻塞用户数据的读取,也会在数据读取的过程中阻塞用户的数据写入
- 数据单独写入或读取,速度过程较快且占用资源相对较少
2.2MyISAM适用的生产场景
- 公司业务不需要事务的支持
- 单方面读取或写入数据比较多的业务
- MyISAM存储引擎数据读写都比较频繁
- 使用读写并发访问相对较低的业务
- 数据修改相对较少的业务
- 对业务一致性要求不是非常高的业务
- 服务器硬件资源相对较差
2.3InnoDB特点
- 支持事务处理、外键约束,缓存能力较好,支持行级锁定,读写并发能力较好,5.5版本后支持全文索引,适用于一致性要求高、数据更新频繁的应用场景。
- MySQL从5.5.5版本开始,默认存储引擎为InnoDB
- 读写阻塞与事务隔离级别相关,能非常高效的缓存索引和数据
- 表与主键一簇的方式存储
- 支持分区、表空间,类似oracle数据库
- 行级锁定,但是全表扫描仍然会是表级锁定
- InnoDB中不保存表的行数,InnoDB需要扫描整表来计算行数,而MyISAM只要简单的读出保存好的行数即可。
- 对于自增长的字段,InnoDB中必须包含只有该字段的索引,但在MyISAM表中可以和其他字段一起建立组合索引
- 清空整个表时,InnoDB是一行行的删除,效率非常慢。MyISAM则会重建表
2.4InnoDB适用的生产场景
- 业务需要事务支持
- 行级锁定对高并发有很好的适应能力,但需要确保查询是通过索引来完成
- 业务数据更新较为频繁的场景,如论坛,微博
- 业务数据一致性要求较高,如银行业务
- 硬件设备内存较大,利用InnoDB较好的缓存能力来提高内存利用率,减少磁盘IO的压力
3.MyISAM表支持的不同存储格式
3.1静态(固定长度)表
静态表是默认的存储格式。静态表中的字段都是非可变字段,这样每个记录都是固定长度的,这种存储方式的优点是存储非常迅速,容易缓存,出现故障容易恢复;缺点是占用的空间通常比动态表多。
3.2动态表
动态表包含可变字段,记录不是固定长度的,这样存储的优点是占用空间较少,但是频繁的更新、删除记录会产生碎片,需要定期执行 OPTIMIZE TABLE 语句或 myisamchk -r 命令来改善性能,并且出现故障的时候恢复相对比较困难。
3.3压缩表
压缩表由 myisamchk 工具创建,占据非常小的空间,因为每条记录都是被单独压缩的,所以只有非常小的访问开支。
4. 存储引擎相关命令
4.1查看系统支持的存储引擎
show engines;
4.2查看表使用的存储引擎
方法1:
show table status from 库名 where name='表名'
方法2:
use 库名;
show create table 表名;
4.3修改存储引擎
方法1:通过 alter table 修改
use 库名;
alter table 表名 engine=MyISAM;
方法2:通过修改 /etc/my.cnf 配置文件,指定默认存储引擎并重启服务
vim /etc/my.cnf
......
[mysqld]
......
default-storage-engine=INNODB
systemctl restart mysql.service
注意:此方法只对修改了配置文件并重启mysql服务后新创建的表有效,已经存在的表不会有变更。
方法3:通过 create table 创建表时指定存储引擎
use 库名;
create table 表名(字段1 数据类型,...) engine=MyISAM;
5.InnoDB行锁与索引的关系
InnoDB行锁是通过给索引项加锁来实现的,如果没有索引,InnoDB将通过隐藏的聚簇索引来对记录加锁。
- delete from t1 where id=1; 如果id字段是主键,innodb对于主键使用了聚簇索引,会直接锁住整行记录。
- delete from t1 where name='aaa'; 如果name字段是普通索引,会先锁住索引的两行,接着会锁住相应主键对应的记录。
- delete from t1 where age=23; 如果age字段没有索引,会使用全表扫描过滤,这时表上的各个记录都将加上锁。
6.死锁
死锁一般是事务相互等待对方资源,最后形成环路造成。
6.1案例演示
create table t1(id int primary key, name char(3), age int);
insert into t1 values(1,'aaa',22);
insert into t1 values(2,'bbb',23);
insert into t1 values(3,'aaa',24);
insert into t1 values(4,'bbb',25);
insert into t1 values(5,'ccc',26);
insert into t1 values(6,'zzz',27);
session 1
begin;
delete from t1 where id=5;
delete from t1 where id=1; #死锁发生
session 2
begin;
select * from t1 where id=1 for update;
update t1 set name='abc' where id=5; #死锁发生
6.2如何尽可能避免死锁
- 使用更合理的业务逻辑,以固定的顺序访问表和行。
- 大事务拆小。大事务更倾向于死锁,如果业务允许,将大事务拆小。
- 在同一个事务中,尽可能做到一次锁定所需要的所有资源,减少死锁概率。
- 降低隔离级别。如果业务允许,将隔离级别调低也是较好的选择,比如将隔离级别从RR调整为RC,可以避免掉很多因为gap锁造成的死锁。
- 为表添加合理的索引。如果不使用索引将会为表的每一行记录添加上锁,死锁的概率大大增大。
6.3for update
可以为数据库中的行上一个排它锁。当一个事务的操作未完成时候,其他事务可以读取但是不能写入或更新。
- 共享锁:又叫做读锁,当用户要进行数据的读取时,对数据加上共享锁,共享锁可以同时加上多个。
- 排他锁:又叫做写锁,当用户要进行数据的写入时,对数据加上排他锁,排他锁只可以加一个,它和其它的排他锁,共享锁都相斥。