MySQL索引,事务与存储引擎
一、索引:
1.索引的概念:
(1)数据库索引:
① 是一个排序的列表,存储着索引值和这个值所对应的物理地址。(类似于C语言的链表通过指针指向数据记录的内存地址)
② 无须对整个表进行扫描,通过物理地址就可以找到所需数据,然后访问相应的数据,因此能加快数据库的查询速度。
③ 是表中一列或者若干列值排序的方法,建立索引的目的是加快对表中记录的查找或排序
④ 需要额外的磁盘空间
2.索引的作用:
(1)设置了合适的索引之后,数据库利用各种快速定位技术,能够大大加快查询速度,这是创建索引的最主要的原因。
(2)当表很大或查询涉及到多个表时,使用索引可以成千上万倍地提高查询速度。
(3)可以降低数据库的IO成本,并且索引还可以降低数据库的排序成本。
(4)通过创建唯一性索引,可以保证数据表中每一行数据的唯一性。
(5)可以加快表与表之间的连接。
(6)在使用分组和排序时,可大大减少分组和排序的时间。
(7)建立索引在搜索和恢复数据库中的数据时能显著提高性能
- 索引的副作用:
- 索引需要占用额外的磁盘空间。
对于 MyISAM 引擎而言,索引文件和数据文件是分离的,索引文件用于保存数据记录的地址。
而 InnoDB 引擎的表数据文件本身就是索引文件。 - 更新一个包含索引的表需要比更新一个没有索引的表花费更多的时间,这是由于索引本身也需要更新。因此,理想的做法是仅仅在常常被搜索的列(以及表)上面创建索引。
- 索引需要占用额外的磁盘空间。
3.索引的使用场景:
MySQL优化,哪些字段/场景合适创建索引:
① 小字段
② 唯一性强的字段
③ 更新不频繁,但他的查询效率很高字段
④ 表记录超过300+行
⑤ 主键、外键、唯一键
4.创建索引的原则:
(1)表的主键、外键必须有索引
(2)记录数超过300行的表应该有索引
(3)经常与其他表进行连接的表,在连接字段上应该建立索引
(4)唯一性太差的字段不适合建立索引
(5)更新太频繁的字段不适合创建索引
(6)经常出现在where字句中的字段,特别是大表的字段应该建立索引
(7)索引应该建在选择性高的字段上索引应该建在小字段上,对于大的文本字段甚至超长字段,不要建索引
5.索引的分类:
(1)普通索引:普通索引最基本的索引类型,没有唯一性之类的限制。
直接创建索引
CREATE INDEX 索引名 ON 表名 (列名[(length)]);
#(列名(length)):length是可选项,下同。如果忽略 length 的值,则使用整个列的值作为索引。如果指定,使用列的前 length 个字符来创建索引,这样有利于减小索引文件的大小。在不损失精确性的情况下,长度越短越好。
#索引名建议以“_index”结尾。create index 索引名 on 表名 (字段(LEN));
eg:
对name创建普通索引
create index name_index on phuket (name);
(2)唯一索引:与普通索引类似,但区别是唯一索引列的每个值都唯一唯一索引允许有空值(注意和主键不同)。如果是用组合索引创建,则列值的组合必须唯一。添加唯一键将自动创建唯一索引。
① 直接创建唯一索引
create unique index 索引名 on 表名(列名);
例: unique
create unique index height_index on phuket(height);
show create table phuket;
② 修改表方式创建
ALTER TABLE 表名 ADD UNIQUE 索引名 (列名);
例:alter table phuket add unique hobby_index(hobby);
③ 创建表的时候指定
CREATE TABLE 表名 (字段1 数据类型,字段2 数据类型[,…],UNIQUE 索引名 (列名));
create table phuket (id int,name varchar(20),unique id index (id));
show creat table phuket;
(3)主键索引:是一种特殊的唯一索引,必须指定为“PRIMARY KEY”。一个表只能有一个主键,不允许有空值。 添加主键将自动创建主键索引。
① 创建表的时候指定索引:
CREATE TABLE 表名 ([...],PRIMARY KEY (列名));
create table test1(id int primary key,name varchar(20));
② 修改表方式创建主键索引:
ALTER TABLE 表名 ADD PRIMARY KEY (列名);
alter table test1 add primary key(id);
(4)组合索引:可以是单列上创建的索引,也可以是在多列上创建的索引。需要满足最左原则,因为 select 语句的 where 条件是依次从左往右执行的,所以在使用 select 语句查询时 where 条件使用的字段顺序必须和组合索引中的排序一致,否则索引将不会生效。
CREATE TABLE 表名 (列名1 数据类型,列名2 数据类型,列名3 数据类型,INDEX 索引名 (列名1,列名2,列名3));
select 查询时 where 语句中的条件字段 要与组合索引的字段排列顺序一致(最左原则)
select * from 表名 where 列名1='...' AND 列名2='...' AND 列名3='...';
create table amd1(id int not null,name varchar(20),idcard varchar(20),index index_amd(id,name));
insert into amd1 values(1,'billkin','123123');
show create table amd1;
(5)全文索引:适合在进行模糊查询的时候使用,可用于在一篇文章中检索文本信息。在 MySQL5.6 版本以前FULLTEXT 索引仅可用于 MyISAM 引擎,在 5.6 版本之后 innodb 引擎也支持 FULLTEXT 索引。全文索引可以在 CHAR、VARCHAR 或者 TEXT 类型的列上创建。
CREATE FULLTEXT INDEX 索引名 ON 表名 (列名);
create fulltext index passwd_index on phuket(passwd);
6. 查看索引:
show index from 表名;
show index from 表名\G; 竖向显示表索引信息
show keys from 表名;
show keys from 表名\G;
各字段的含义如下:
Table 表的名称
Non_unique 如果索引内容唯一,则为 0;如果可以不唯一,则为 1。
Key_name 索引的名称。
Seq_in_index 索引中的列序号,从 1 开始。 limit 2,3
Column_name 列名称。
Collation 列以什么方式存储在索引中。在 MySQL 中,有值‘A’(升序)或 NULL(无分类)。
Cardinality 索引中唯一值数目的估计值。
Sub_part 如果列只是被部分地编入索引,则为被编入索引的字符的数目(zhangsan)。如果整列被编入索引,则为 NULL。
Packed 指示关键字如何被压缩。如果没有被压缩,则为 NULL。
Null 如果列含有 NULL,则含有 YES。如果没有,则该列含有 NO。
Index_type 用过的索引方法(BTREE, FULLTEXT, HASH, RTREE)。
Comment 备注。
7.删除索引:
DROP INDEX 索引名 ON 表名;
drop index passwd_index on phuket;
二、事务介绍:
1.事务的概念:
(1)事务是一种机制、一个操作序列,包含了一组数据库操作命令,并且把所有的命令作为一个整体一起向系统提交或撤销操作请求,即这一组数据库命令要么都执行,要么都不执行。
(2)事务是一个不可分割的工作逻辑单元,在数据库系统上执行并发操作时,事务是最小的控制单元。
(3)事务适用于多用户同时操作的数据库系统的场景,如银行、保险公司及证券交易系统等等。
(4)事务通过事务的整体性以保证数据的一致性。
(5)事务能够提高在向表中更新和插入信息期间的可靠性。
总:
说白了,所谓事务,它是一个操作序列,这些操作要么都执行,要么都不执行,它是一个不可分割的工作单位。
2.事务的ACID特点:
ACID,是指在可靠数据库管理系统(DBMS)中,事务(transaction)应该具有的四个特性:原子性(Atomicity)、一致性(Consistency)、隔离性(Isolation)、持久性(Durability)。这是可靠数据库所应具备的几个特性。
(1)原子性:
(1)指事务是一个不可再分割的工作单位,事务中的操作要么都发生,要么都不发生。
(2)事务是一个完整的操作,事务的各元素是不可分的。
(3)事务中的所有元素必须作为一个整体提交或回滚。
(4)如果事务中的任何元素失败,则整个事务将失败。
案例理解:
A给B转帐100元钱的时候只执行了扣款语句,就提交了,此时如果突然断电,A账号已经发生了扣款,B账号却没收到加款,在生活中就会引起纠纷。这种情况就需要事务的原子性来保证事务要么都执行,要么就都不执行。
(2)一致性:
(1)指在事务开始之前和事务结束以后,数据库的完整性约束没有被破坏。
(2)当事务完成时,数据必须处于一致状态。
(3)在事务开始前,数据库中存储的数据处于一致状态。
(4)在正在进行的事务中,数据可能处于不一致的状态。
(5)当事务成功完成时,数据必须再次回到已知的一致状态。
案例理解:
对银行转帐事务,不管事务成功还是失败,应该保证事务结束后表中A和B的存款总额跟事务执行前一致。
(3)隔离性:
(1)指在并发环境中,当不同的事务同时操纵相同的数据时,每个事务都有各自的完整数据空间。
(2)对数据进行修改的所有并发事务是彼此隔离的,表明事务必须是独立的,它不应以任何方式依赖于或影响其他事务。
(3)修改数据的事务可在另一个使用相同数据的事务开始之前访问这些数据,或者在另一个使用相同数据的事务结束之后访问这些数据。
总:
也就是说并发访问数据库时,一个用户的事务不被其他事务所干扰,各并发事务之间数据库是独立的。
(4)持久性:
(1)在事务完成以后,该事务所对数据库所作的更改便持久的保存在数据库之中,并不会被回滚。
(2)指不管系统是否发生故障,事务处理的结果都是永久的。
(3)一旦事务被提交,事务的效果会被永久地保留在数据库中。
-
扩展:事务之间的相互影响分为几种?
-
-
脏读(读取未提交数据):
(1)脏读(读取未提交数据): 脏读指的是读到了其他事务未提交的数据,未提交意味着这些数据可能会回滚也就是可能最终不会存到数据库中,也就是不存在的数据。读到了并一定最终存在的数据,这就是脏读。
(2)当前事务读到的数据是别的事务想要修改成为的但是没有修改成功的数据。
-
不可重复读(前后多次读取,数据内容不一致):
(1)指在一个事务内,多次读同一数据。在这个事务还没有结束时,另外一个事务也访问该同一数据。那么,在第一个事务中的两次读数据之间,由于第二个事务的修改,那么第一个事务两次读到的的数据可能是不一样的。这样就发生了在一个事务内两次读到的数据是不一样的,因此称为是不可重复读。(即不能读到相同的数据内容)
(2)一个事务内两个相同的查询却返回了不同数据。这是由于查询时系统中其他事务修改的提交而引起的。
(3)事务A第一次查询得到一行记录row1,事务B提交修改后,事务A第二次查询得到row1,但列内容发生了变化。事务B两次读取数据不一致的现象可称为不可重复读
-
幻读(前后多次读取,数据总量不一致):
(1)一个事务对一个表中的数据进行了修改,这种修改涉及到表中的全部数据行。同时,另一个事务也修改这个表中的数据,这种修改是向表中插入一行新数据。
(2)操作前一个事务的用户会发现表中还有一个没有修改的数据行,就好象发生了幻觉一样。
-
丢失更新(两个事务同时读取同一条记录后修改后提交覆盖):
两个事务同时读取同一条记录,A先修改记录,B也修改记录(B不知道A修改过),B提交数据后B的修改结果覆盖了A的修改结果。
-
3.事务隔离级别:
(1)read uncommitted( : 读取尚未提交的数据 :不解决脏读
允许脏读,其他事务只要修改了数未提交读)据,即使未提交,本事务也能看到修改后的数据值。也就是可能读取到其他会话中未提交事务修改的数居。
(2)read committed(提交读):读取已经提交的数据 :可以解决脏读
只能读取到已经提交的数据。Oracle等多数数据库默认都是该级别〈不重复读)。
(3)repeatable read(可重复度):重读读取:可以解决脏读 和 不可重复读 —mysql默认的
可重复读。无论其他事务是否修改并提交了数据,在这个事务中看到的数据值始终不受其他事务影响
(4)serializable:串行化:可以解决 脏读 不可重复读 和 虚读—相当于锁表
完全串行化的读,每次读都需要获得表级共享锁,读写相互都会阻塞。
mysql默认的事务处理级别是 repeatable read ,而Oracle和SQL Server是 read committed 。
4.事务的控制语句:
BEGIN 或 START TRANSACTION:显式地开启一个事务。
COMMIT 或 COMMIT WORK:提交事务,并使已对数据库进行的所有修改变为永久性的。
ROLLBACK 或 ROLLBACK WORK:回滚会结束用户的事务,并撤销正在进行的所有未提交的修改。
SAVEPOINT S1:使用 SAVEPOINT 允许在事务中创建一个回滚点,一个事务中可以有多个 SAVEPOINT;“S1”代表回滚点名称。
ROLLBACK TO [SAVEPOINT] S1:把事务回滚到标记点
三、MySQL存储引擎:
1.概念介绍:
MySQL中的数据用各种不同的技术存储在文件中,每一种技术都使用不同的存储机制、索引技巧、锁定水平并最终提供不同的功能和能力,这些不同的技术以及配套的功能在MySQL中称为存储引擎存储引擎是MySQL将数据存储在文件系统中的存储方式或者存储格式。
2.MyISAM 表支持 3 种不同的存储格式:
(1)静态(固定长度)表
静态表是默认的存储格式。静态表中的字段都是非可变字段,这样每个记录都是固定长度的,这种存储方式的优点是存储非常迅速,容易缓存,出现故障容易恢复;缺点是占用的空间通常比动态表多。
(2)动态表
动态表包含可变字段(varchar),记录不是固定长度的,这样存储的优点是占用空间较少,但是频繁的更新、删除记录会产生碎片,需要定期执行 OPTIMIZE TABLE 语句或 myisamchk -r 命令来改善性能,并且出现故障的时候恢复相对比较困难。
(3)压缩表
压缩表由 myisamchk 工具创建,占据非常小的空间,因为每条记录都是被单独压缩的,所以只有非常小的访问开支。
3.MyISAM适用的生产场景:
(1)公司业务不需要事务的支持
(2)单方面读取或写入数据比较多的业务
(3)MyISAM存储引擎数据读写都比较频繁场景不适合
(4)使用读写并发访问相对较低的业务
(5)数据修改相对较少的业务
(6)对数据业务一致性要求不是非常高的业务
(7)服务器硬件资源相对比较差
MyIsam:适合于单方向的任务场景、同时并发量不高、对于事务要求不高的场景
4.InnoDB:
(1)InnoDB特点:
① 支持事务,支持4个事务隔离级别(数据不一致问题)
② MySQL从5.5.5版本开始,默认的存储引擎为 InnoDB
③ 5.5 之前是myisam (isam) 默认
-
读写阻塞与事务隔离级别相关:
- 能非常高效的缓存索引和数据
- 表与主键以簇的方式存储
- 支持分区、表空间,类似oracle数据库(5.5 ——》5.6 和5.7 第三代数据库8.0后版本)
- 支持外键约束,5.5前不支持全文索引,5.5后支持全文索引
-
对硬件资源要求还是比较高的场合:
行级锁定,但是全表扫描仍然会是表级锁定(select ),如update table set a=1 where user like ‘%lic%’; -
InnoDB 中不保存表的行数,如 select count() from table; 时,InnoDB 需要扫描一遍整个表来计算有多少行,但是 MyISAM 只要简单的读出保存好的行数即可。需要注意的是,当 count()语句包含 where 条件时 MyISAM 也需要扫描整个表,对于自增长的字段,InnoDB 中必须包含只有该字段的索引,但是在 MyISAM 表中可以和其他字段一起建立组合索引,清空整个表时,InnoDB 是一行一行的删除,效率非常慢。MyISAM 则会重建表(truncate)
-
死锁
MyISAM :表级锁定
innodb :行级锁定 -
当两个请求分别访问/读取2行记录,同时又需要读取对方的记录数据,因为(行锁的限制)而造成了阻塞的现象
-
企业选择存储引擎依据:
- 业务场景如果并发量大,什么并发量大,读写的并发量大,那我们建议使用innoDB 如果单独的写入或是插入单独的查询,那我们建议使用没有INNODB
表级锁:开销小,加锁快;不会出现死锁;锁定粒度大,发生锁冲突的概率最高,并发度最低;
行级锁:开销大,加锁慢;会出现死锁;锁定粒度最小,发生锁冲突的概率最低,并发度也最高;
MyISAM不支持事务,也不支持外键约束,只支持全文索引,数据文件和索引文件是分开保存的
需要考虑每个存储引擎提供了哪些不同的核心功能及应用场景
-
支持的字段和数据类型
- 所有引擎都支持通用的数据类型
- 但不是所有的引擎都支持其它的字段类型,如二进制对象
-
锁定类型:不同的存储引擎支持不同级别的锁定
- 表锁定: MyISAM 支持
- 行锁定: InnoDB 支持
-
索引的支持:
- 建立索引在搜索和恢复数据库中的数据时能显著提高性能
- 不同的存储弓|擎提供不同的制作索引的技术
- 有些存储弓|擎根本不支持索引
-
事务处理的支持:
- 提高在向表中更新和插入信息期间的可靠性
死锁;锁定粒度最小,发生锁冲突的概率最低,并发度也最高;
- 提高在向表中更新和插入信息期间的可靠性
MyISAM不支持事务,也不支持外键约束,只支持全文索引,数据文件和索引文件是分开保存的
需要考虑每个存储引擎提供了哪些不同的核心功能及应用场景
-
支持的字段和数据类型
- 所有引擎都支持通用的数据类型
- 但不是所有的引擎都支持其它的字段类型,如二进制对象
-
锁定类型:不同的存储引擎支持不同级别的锁定
- 表锁定: MyISAM 支持
- 行锁定: InnoDB 支持
-
索引的支持:
- 建立索引在搜索和恢复数据库中的数据时能显著提高性能
- 不同的存储弓|擎提供不同的制作索引的技术
- 有些存储弓|擎根本不支持索引
-
事务处理的支持:
- 提高在向表中更新和插入信息期间的可靠性
- 可根据企业业务是否要支持事务选择存储引擎