《mysql篇》--索引事务

索引

索引的介绍

索引是帮助MySQL高效获取数据的数据结构，是一种特殊的文件，包含着对数据表里所有记录的引用指针，因为索引本身也比较大，所以索引一般是存储在磁盘上的，索引的种类有很多，不过如果没有特殊说明，我们一般认为索引是一个B+树的结构。

索引的作用

优势：

可以提高列检索的效率，降低搜索成本。
对提高数据库的性能有很大的作用。
通过索引对数据进行，排序也可以大大提高排序效率
数据库中的表、数据、索引之间的关系，类似于书架上的图书、书籍内容和书籍目录的关系。

劣势：

会占用磁盘空间
有时可能会比较危险，在创建索引时需要对现有的数据，进行大规模的从新整理(调整存储的数据结构),如果当前是一个空表，或者数据不多，创建索引一般没有什么问题，如果这个表本来就很大，此时创建索引就需要对所有数据进行重新调整结构，重新存储，就有可能把服务器给卡住，一般来说，创建索引都是在创建表时就规划好的。

索引的使用

查看索引

show index from 表名；

举例：

 create table demo(
id int primary key,
age int,
name varchar(20));
show index from demo;

创建索引

create index 索引名字 on 表名(列名);

举例：

create index index_id on demo(id);
show index from demo;

//这里的举例只是为了讲解

删除索引

drop index 索引名 on 表名;

 drop index index_id on demo;
 show index from demo;

//主键，unique，外键都是会自动生成索引的

索引内部的原理和逻辑

如果没有特殊说明，我们一般认为索引是一个B+树的结构。

二叉搜索树

博主在之前的博客中有详细讲解过二叉搜索树，如果有兴趣可以去看看。

B树

在将B+树之前我们要先了解一些B树，B树又叫多路平衡查找树，他并不是一棵二叉树，而是一棵多叉树，每个结点有M个子节点，M称为B树的阶，

B树的特点包括：

每个节点可以有多个子节点，这使得B树能够优化大块数据的读写操作。
B树的所有叶子节点都在同一层，保持了树的平衡。
B树中的关键字从小到大排列，每个结点上有M个key，划分出M+1个区间
叶子节点不包含关键字，指向这些外部结点的指针为空，叶子结点的数目正好等于树中所包含的关键字总个数加1。

每个结点可以看作是一个区间，从无穷小到无穷大，每一个关键字都会将这个区间划分，每个小区间又可以向下延申出子结点，又或者说每个结点里所包含的关键字大小，都在其对应的父结点，的相应的小区间里

举例:查找7

首先从根结点开始，7比10小，所以在10左边的区间，然后继续查找比较，7比3大，在3右边的区间，继续查找比较，在这个结点中可以查找到7，查找结束。

进行查询的时候，就可以直接从根结点出发，判定当前要查找的数据在节点上的哪个区间，决定下一步往哪里走，进行添加/删除元素可能会涉及到结点的拆分和结点的合并

//B树可以有效的减少访问硬盘的次数，从而大大提高检索的性能

B+树

为了进一步提高检索的性能，在B树的基础上改造得到了B+树，B+树是B树的改进，针对数据库量身定做
B+树也是一个N叉搜索树，一个结点上存在N个key，划分成N个区域
每个节点上N个key中，最后一个就相当于当前子树的最大值
父节点上的每个key都会以最大值的身份，在子节点的对应区间中存在(key可能会重复出现)
叶子节点这一层，包含整个树的数据全集
B+树会以链表的形式，把叶子节点串起来(此时就方便我们进行遍历，也方便按照范围取出一个子集)

假如说要查询id>26 and id<62的就可以根据head进行查找

B+树的优点(相较于B树以及哈希，红黑树)

N叉搜索树，树的高度有限，降低了IO次数，增加了效率
范围查找效率较高
所有查询的最终结果都落到子节点，查询次数较稳定
由于叶子结点是全集，会把行数据只存储在叶子节点上，非叶子节点只是存储一个用来排序的key(比如存个id)

事务

事务的介绍

我们先来举一个例子，假如我们现在要去银行把钱转账给另一个人，那么把这个操作简化为MySQL语句的话，就是我的账户删除一条数据，另一个人的账户插入一条数据，那么假如中间出现了错误，我的账户少了，另一个人的账户没有变，这样的场景显然是不合理的。

事务就是将多条sql语句打包为一个整体，要么都执行，要么都不执行，事务把多个sql打包为一个整体来执行，称之为“原子性”(意为不可再拆分)。

也就是说，在执行事务时如果其中有一条或者多条语句出现错误，那么所有执行的语句都会回滚(回到执行前的状态),收到影响的数据也会回到事务开始之前的状态，当所有语句都执行成功后事务也就顺利进行了

事务不仅仅有原子性，还有一些其他方面的特性

原子性：回滚的方式，保证这一系列操作都能执行正确，或者恢复如初
一致性：事务执行之前，和之后要保证数据的合理性，比如不能出现前文例子中的，一方账户的金额少了，一方账户金额不变
持久性：事务做出的修改都是在硬盘上持久保存的，重启服务器，数据仍然存在，事务执行的修改任然是有效的
隔离性：一个事务的执行不能被其他事务干扰，数据库在并发执行时事务之间是隔离的

事务的使用

隐式事务

没有明确的开始和提交的标志，具有自动开始和提交事务的功能，在默认状态下mysql就是自动提交事务

显式事务

和隐式事务不同需要自己，手动开始事务和提交(commit)/回滚(rollback)，在使用显式事务时要先将自动提交事务关掉，方法就是将变量autocommit的值改为0

首先准备一个表

具体步骤如下

#第一步开始事务
start transaction;
#第二步编写事务中的sql语句
update test2 set gpa = 3.8 where id = 6;
update test2 set gpa = 4.1 where id = 5;
#第四步提交事务
commit;
#rollback，回滚事务，将数据回到执行事务之前

并发事务时会遇到的问题

脏读

一个事务A正在写数据的过程中，另一个事务B读取了同一个数据，接下来事务A又修改了数据，导致B之前读的数据是一个无效的数据/过时的数据(也称为脏数据)

解决脏读的核心思路，就是对写操作进行加锁(规定在A写的时候B不可以读)，之前A和B时并发执行的，在加锁之后，并发程度和效率就降低了，但是隔离性和数据准确性提高了

不可重复读

在并发执行事务的过程中，如果事务A在内部多次读取同一个数据的时候，出现不同的情况，这种情况就是不可重复读，即事务A在两次相邻的读取操作之间，有一个事务B修改了数据并提交了事务。

刚刚写加锁时，我们只是规定在写的时候不能读，但是没有规定在读的时候不能写，那么我们想要解决不可重复读就要再进一步加锁，也就是规定在读的时候也不能写。

这样之后，并发程度和效率就又降低了，但是隔离性和数据准确性依然提高了

幻读

一个事务A执行过程中，两次读取操作，数据内容虽然没改变，但是结果集变了(比如又多出一个文件)，虽然我们刚刚约定了，在读的时候能写，在写的时候不能读但是，当事务A再写A文件的时候事务B不能读A文件，但是事务B可以读B文件

这时我们只好从根本上解决，将两个事务完全分离，比如A执行完了之后才能执行B，这样就完全没有并发，效率自然是最低，但是隔离性和数据准确性都是最高