大家好。上篇文章我们讲了事务并发执行时可能带来的各种问题,今天我们来聊一聊mysql面试必问的问题–锁。
一、解决并发事务带来问题的两种基本方式
1. 并发事务访问相同记录的情况
并发事务访问相同记录的情况大致可以划分为3种:
读-读情况: 即并发事务相继读取相同的记录。
读取操作本身不会对记录有任何影响,并不会引起什么问题,所以允许这种情况的发生。
写-写情况: 即并发事务相继对相同的记录做出改动。
我们知道,在这种情况下会发生脏写的问题,任何一种隔离级别都不允许这种问题的发生。所以在多个未提交事务相继对一条记录做改动时,需要让它们排队执行,这个排队的过程其实是通过锁来实现的。
这个所谓的锁其实是一个内存中的结构,在事务执行前本来是没有锁的,也就是说一开始是没有锁结构和记录进行关联的,如图所示:
当一个事务想对这条记录做改动时,首先会看看内存中有没有与这条记录关联的锁结构 ,当没有的时候就会在内存中生成一个锁结构与之关联。比方说事务T1要对这条记录做改动,就需要生成一个锁结构与之关联:
其实在锁结构里有很多信息,为了简化理解,我们现在只把两个比较重要的属性拿了出来:
trx信息: 代表这个锁结构是哪个事务生成的。
is_waiting: 代表当前事务是否在等待。
如上图所示,当事务T1改动了这条记录后,就生成了一个锁结构与该记录关联,因为之前没有别的事务为这条记录加锁,所以is_waiting属性就是false ,我们把这个场景就称之为获取锁成功,或者加锁成功,然后就可以继续执行操作了。
在事务 T1 提交之前,另一个事务T2 也想对该记录做改动,那么先去看看有没有锁结构与这条记录关联,发现有一个锁结构与之关联后,然后也生成了一个锁结构与这条记录关联,不过锁结构的is_waiting属性值为 true,表示当前事务需要等待,我们把这个场景就称之为获取锁失败,或者加锁失败,或者没有成功的获取到锁,画个图表示就是这样:
在事务T1提交之后,就会把该事务生成的锁结构释放掉,然后看看还有没有别的事务在等待获取锁,发现了事务T2还在等待获取锁,所以把事务T2对应的锁结构的is_waiting属性设置为false,然后把该事务对应的线程唤醒,让它继续执行,此时事务T2就算获取到锁了。效果图就是这样:
我们总结一下后续内容中可能用到的几种说法,以免大家混淆:
不加锁:意思就是不需要在内存中生成对应的锁结构,可以直接执行操作。
获取锁成功,或者加锁成功:意思就是在内存中生成了对应的锁结构,而且锁结构的is_waiting属性为false,也就是事务可以继续执行操作。
获取锁失败,或者加锁失败,或者没有获取到锁:意思就是在内存中生成了对应的 锁结构 ,不过锁结构的 is_waiting 属性为 true ,也就是事务需要等待,不可以继续执行操作。
读-写或写-读情况: 也就是一个事务进行读取操作,另一个进行改动操作。
我们知道,这种情况下可能发生脏读、不可重复读、幻读的问题。
注意:幻读问题的产生是因为某个事务读了一个范围的记录,之后别的事务在该范围内插入了新记录,该事务再次读取该范围的记录时,可以读到新插入的记录,所以幻读问题准确的说并不是因为读取和写入一条相同记录而产生的。
怎么解决脏读、不可重复读、幻读这些问题呢?其实有两种可选的解决方案:
方案一:读操作利用多版本并发控制( MVCC ),写操作进行加锁。
所谓的MVCC就是通过生成一个ReadView,然后通过ReadView找到符合条件的记录版本(历史版本是由undo日志构建的),查询语句只能读到在生成ReadView之前已提交事务所做的更改,在生成ReadView之前未提交的事务或者之后才开启的事务所做的更改是看不到的。而写操作肯定针对的是最新版本的记录,读记录的历史版本和改动记录的最新版本本身并不冲突,也就是采用MVCC时, 读-写操作并不冲突。
我们说过普通的SELECT语句在READ COMMITTED和REPEATABLE READ隔离级别下会使用到MVCC读取记录。在READ COMMITTED隔离级别下,一个事务在执行过程中每次执行SELECT操作时都会生成一个ReadView,ReadView的存在本身就保证了事务不可以读取到未提交的事务所做的更改,也就是避免了脏读现象;REPEATABLE READ隔离级别下,一个事务在执行过程中只有第一次执行SELECT操作才会生成一个ReadView,之后的SELECT操作都复用这个ReadView,这样也就避免了不可重复读和幻读的问题。
方案二:读、写操作都采用加锁的方式。
如果我们的一些业务场景不允许读取记录的旧版本,而是每次都必须去读取记录的最新版本,比方在银行存款的事务中,你需要先把账户的余额读出来,然后将其加上本次存款的数额,最后再写到数据库中。在将账户余额读取出来后,就不想让别的事务再访问该余额,直到本次存款事务执行完成,其他事务才可以访问账户的余额。这样在读取记录的时候也就需要对其进行加锁操作,这样也就意味着读操作和写操作也像写-写操作那样排队执行。
我们说脏读的产生是因为当前事务读取了另一个未提交事务写的一条记录,如果另一个事务在写记录的时候就给这条记录加锁,那么当前事务就无法继续读取该记录了,所以也就不会有脏读问题的产生了。
不可重复读的产生是因为当前事务先读取一条记录,另外一个事务对该记录做了改动之后并提交之后,当前事务再次读取时会获得不同的值,如果在当前事务读取记录时就给该记录加锁,那么另一个事务就无法修改该记录,自然也不会发生不可重复读了。
我们说幻读问题的产生是因为当前事务读取了一个范围的记录,然后另外的事务向该范围内插入了新记录,当前事务再次读取该范围的记录时发现了新插入的新记录,我们把新插入的那些记录称之为幻影记录。采用加锁的方式解决幻读问题有一点麻烦,因为当前事务在第一次读取记录时那些幻影记录并不存在,所以读取的时候加锁就会不知道给谁加锁。我们稍后讲解如何解决这个问题。
很明显,采用MVCC方式的话, 读-写操作彼此并不冲突,性能更高,采用加锁方式的话, 读-写操作彼此需要排队执行,影响性能。一般情况下我们当然愿意采用MVCC来解决读-写操作并发执行的问题,但是业务在某些特殊情况下,要求必须采用加锁的方式执行,那也是没有办法的事。
2. 一致性读(Consistent Reads)
事务利用MVCC进行的读取操作称之为一致性读 ,或者一致性无锁读 ,有的地方也称之为快照读 。所有普通的SELECT语句( plain SELECT )在READ COMMITTED、 REPEATABLE READ隔离级别下都算是一致性读 ,比方说:
SELECT * FROM t;
SELECT * FROM t1 INNER JOIN t2 ON t1.col1 = t2.col2
一致性读并不会对表中的任何记录做加锁操作,其他事务可以自由的对表中的记录做改动。
3. 锁定读(Locking Reads)
1. 共享锁和独占锁
我们前边说过,并发事务的读-读情况并不会引起什么问题,不过对于 写-写、 读-写或写-读这些情况可能会引起一些问题,需要使用MVCC或者 加锁的方式来解决它们。在使用加锁的方式解决问题时,由于既要允许读-读情况不受影响,又要使写-写、读-写或写-读情况中的操作相互阻塞,所以MySQL 给锁分了个类:
共享锁,英文名:Shared Locks,简称S锁。在事务要读取一条记录时,需要先获取该记录的S锁 。
独占锁,也常称排他锁,英文名:Exclusive Locks,简称X锁。在事务要改动一条记录时,需要先获取该记录的X锁 。
假如事务T1首先获取了一条记录的S锁之后,事务T2接着也要访问这条记录:
如果事务T2想要再获取一个记录的S锁,那么事务T2也会获得该锁,也就意味着事务T1和T2在该记录上同时持有 S锁 。
如果事务T2想要再获取一个记录的X锁 ,那么此操作会被阻塞,直到事务T1提交之后将S锁释放掉。
如果事务T1首先获取了一条记录的X锁之后,那么不管事务T2接着想获取该记录的S锁还是X锁都会被阻塞,直到事务T1提交。
所以我们说S锁和S锁是兼容的, S锁和X锁是不兼容的, X锁和X锁也是不兼容的。
2. 锁定读的语句
我们前边说在采用加锁方式解决脏读、不可重复读、幻读这些问题时,读取一条记录时需要获取一下该记录的S锁 ,其实这是不严谨的,有时候想在读取记录时就获取记录的X锁 ,来禁止别的事务读写该记录,为此MySQL提出了两种比较特殊的SELECT语句格式:
对读取的记录加 S锁 :
SELECT ... LOCK IN SHARE MODE;
也就是在普通的SELECT语句后边加LOCK IN SHARE MODE,如果当前事务执行了该语句,那么它会为读取到的记录加S锁 ,这样允许别的事务继续获取这些记录的S锁,但是不能获取这些记录的X锁。如果别的事务想要获取这些记录的X锁 ,那么它们会阻塞,直到当前事务提交之后将这些记录上的S锁释放掉。
对读取的记录加X锁 :
SELECT ... FOR UPDATE;
也就是在普通的SELECT语句后边加FOR UPDATE,如果当前事务执行了该语句,那么它会为读取到的记录加X锁 ,这样既不允许别的事务获取这些记录的S锁,也不允许获取这些记录的X锁。如果别的事务想要获取这些记录的S锁或者X锁,那么它们会阻塞,直到当前事务提交之后将这些记录上的X锁释放掉。
关于更多 锁定读 的加锁细节我们稍后会详细唠叨,稍安勿躁。
4. 写操作
平常所用到的写操作无非是DELETE、UPDATE、INSERT这三种:
DELETE: 对一条记录做DELETE操作的过程其实是先在B+树中定位到这条记录的位置,然后获取一下这条记录的X锁,然后再执行delete mark 操作。我们也可以把这个定位待删除记录在B+树中位置的过程看成是一个获取X锁的锁定读。
UPDATE: 在对一条记录做UPDATE操作时分为三种情况:
如果未修改该记录的键值并且被更新的列占用的存储空间在修改前后未发生变化,则先在B+树中定位到这条记录的位置,然后再获取一下记录的X锁,最后在原记录的位置进行修改操作。其实我们也可以把这个定位待修改记录在B+树中位置的过程看成是一个获取X锁的锁定读。
如果未修改该记录的键值并且至少有一个被更新的列占用的存储空间在修改前后发生变化,则先在B+树中定位到这条记录的位置,然后获取一下记录的X锁,将该记录彻底删除掉(就是把记录彻底移入垃圾链表),最后再插入一条新记录。这个定位待修改记录在B+树中位置的过程看成是一个获取X锁的锁定读,新插入的记录由 INSERT 操作提供的隐式锁进行保护。
如果修改了该记录的键值,则相当于在原记录上做DELETE操作之后再来一次INSERT操作,加锁操作就需要按照 DELETE 和 INSERT 的规则进行了。
INSERT: 一般情况下,新插入一条记录的操作并不加锁,InnoDB通过一种称之为隐式锁的东西来保护这条新插入的记录在本事务提交前不被别的事务访问。
二、多粒度锁
我们前边提到的锁都是针对记录的,也可以被称之为行级锁或者行锁 ,对一条记录加锁影响的也只是这条记录而已,我们就说这个锁的粒度比较细;其实一个事务也可以在表级别进行加锁,自然就被称之为表级锁或者表锁,对一个表加锁影响整个表中的记录,我们就说这个锁的粒度比较粗。给表加的锁也可以分为共享锁( S锁 )和 独占锁 ( X锁 ):
给表加S锁:如果一个事务给表加了S锁,那么:
别的事务可以继续获得该表的S锁
别的事务可以继续获得该表中的某些记录的S锁
别的事务不可以继续获得该表的X锁
别的事务不可以继续获得该表中的某些记录的X锁
给表加X锁:如果一个事务给表加了X锁,那么:
别的事务不可以继续获得该表的S锁
别的事务不可以继续获得该表中的某些记录的S锁
别的事务不可以继续获得该表的X锁
别的事务不可以继续获得该表中的某些记录的X锁
那么我们在对表上锁( 表锁 )时,怎么知道表中有没有记录已经被上锁( 行锁 )了呢?对此InnoDB提出了一种称之为意向锁(英文名:Intention Locks )的东西:
意向共享锁,英文名:Intention Shared Lock,简称IS锁 。当事务准备在某条记录上加S锁时,需要先在表级别加一个IS锁 。
意向独占锁,英文名:Intention Exclusive Lock,简称IX锁。当事务准备在某条记录上加X锁时,需要先在表级别加一个IX锁 。
总结一下:IS、IX锁是表级锁,它们的提出仅仅为了在之后加表级别的S锁和X锁时可以快速判断表中的记录是否被上锁,以避免用遍历的方式来查看表中有没有上锁的记录,也就是说其实IS锁和IX锁是兼容的,IX锁和IX锁是兼容的。我们画个表来看一下表级别的各种锁的兼容性:
兼容性 | X | IX | S | IS |
---|---|---|---|---|
X | 不兼容 | 不兼容 | 不兼容 | 不兼容 |
IX | 不兼容 | 兼容 | 不兼容 | 兼容 |
S | 不兼容 | 不兼容 | 兼容 | 兼容 |
IS | 不兼容 | 兼容 | 兼容 | 兼容 |
三、MySQL中的行锁和表锁
我们知道,MySQL支持多种存储引擎,不同存储引擎对锁的支持也是不一样的。我们重点讨论InnoDB存储引擎中的锁,其他的存储引擎我们稍微提一下
1. 其他存储引擎中的锁
对于MyISAM、MEMORY、 MERGE这些存储引擎来说,它们只支持表级锁,而且这些引擎并不支持事务,所以使用这些存储引擎的锁一般都是针对当前会话来说的。比方说在Session 1中对一个表执行SELECT操作,就相当于为这个表加了一个表级别的S锁 ,如果在SELECT操作未完成时, Session 2中对这个表执行UPDATE操作,相当于要获取表的X锁,此操作会被阻塞,直到Session 1中的SELECT操作完成,释放掉表级别的S锁 后,Session 2中对这个表执行UPDATE操作才能继续获取X锁 ,然后执行具体的更新语句。
因为使用MyISAM、MEMORY、MERGE这些存储引擎的表在同一时刻只允许一个会话对表进行写操作,所以这些存储引擎实际上最好用在只读,或者大部分都是读操作,或者单用户的情景下。另外,在MyISAM存储引擎中有一个称之为Concurrent Inserts的特性,支持在对MyISAM表读取时同时插入记录,这样可以提升一些插入速度。
2. InnoDB存储引擎中的锁
InnoDB 存储引擎既支持表锁,也支持行锁。表锁实现简单,占用资源较少,不过粒度很粗,有时候仅仅需要锁住几条记录,但使用表锁的话相当于为表中的所有记录都加锁,所以性能比较差。行锁粒度更细,可以实现更精准的并发控制。下边我们详细看一下。
1. InnoDB中的表级锁
表级别的S锁、X锁:在对某个表执行SELECT、INSERT、DELETE、 UPDATE语句时, InnoDB 存储引擎是不会为这个表添加表级别的S锁或者 X锁的。
另外,在对某个表执行一些诸如ALTER TABLE、DROP TABLE这类的 DDL语句时,其他事务对这个表并发执行诸如SELECT、INSERT、 DELETE、UPDATE的语句会发生阻塞,同理,某个事务中对某个表执行SELECT、INSERT、DELETE、UPDATE语句时,在其他会话中对这个表执行DDL语句也会发生阻塞。这个过程其实是通过在server层使用一种称之为元数据锁(英文名:Metadata Locks,简称MDL)来实现的,一般情况下也不会使用InnoDB存储引擎自己提供的表级别的S锁和X锁。
其实这个InnoDB存储引擎提供的表级S锁或者X锁是相当鸡肋,只会在一些特殊情况下,比方说崩溃恢复过程中用到。不过我们还是可以手动获取一下的,比方说在系统变量 autocommit=0,innodb_table_locks =1 时,手动获取InnoDB存储引擎提供的表t的S锁或者X锁可以这么写:
LOCK TABLES t READ:InnoDB存储引擎会对表t加表级别的S锁 。
LOCK TABLES t WRITE:InnoDB存储引擎会对表t加表级别的X锁 。
不过请尽量避免在使用InnoDB存储引擎的表上使用LOCK TABLES这样的手动锁表语句,它们并不会提供什么额外的保护,只是会降低并发能力而已。
表级别的IS锁、IX锁:当我们在对使用InnoDB存储引擎的表的某些记录加S锁之前,那就需要先在表级别加一个IS锁,当我们在对使用InnoDB 存储引擎的表的某些记录加X锁之前,那就需要先在表级别加一个IX锁。IS锁和IX锁的使命只是为了后续在加表级别的S锁和X锁时判断表中是否有已经被加锁的记录,以避免用遍历的方式来查看表中有没有上锁的记录。
表级别的 AUTO-INC锁:在使用MySQL过程中,我们可以为表的某个列添加 AUTO_INCREMENT 属性,之后在插入记录时,可以不指定该列的值,系统会自动为它赋上递增的值,比方说我们有一个表:
CREATE TABLE t (
id INT NOT NULL AUTO_INCREMENT,
c VARCHAR(100),
PRIMARY KEY (id)
) Engine=InnoDB CHARSET=utf8;
由于这个表的id字段声明了AUTO_INCREMENT,也就意味着在书写插入语句时不需要为其赋值,比方说这样:
INSERT INTO t(c) VALUES('aa'), ('bb');
上边的插入语句并没有为id列显式赋值,所以系统会自动为它赋上递增的值,效果就是这样:
系统实现这种自动给 AUTO_INCREMENT修饰的列递增赋值的原理主要是两个:
- 采用 AUTO-INC锁,也就是在执行插入语句时就在表级别加一个 AUTO-INC 锁,然后为每条待插入记录的AUTO_INCREMENT修饰的列分配递增的值,在该语句执行结束后,再把 AUTO-INC锁释放掉。这样一个事务在持有 AUTO-INC 锁的过程中,其他事务的插入语句都要被阻塞,可以保证一个语句中分配的递增值是连续的。
如果我们的插入语句在执行前不可以确定具体要插入多少条记录(无法预计即将插入记录的数量),比方说使用 INSERT … SELECT 、 REPLACE … SELECT或者LOAD DATA这种插入语句,一般是使用AUTO-INC锁为AUTO_INCREMENT修饰的列生成对应的值。
- 采用一个轻量级的锁,在为插入语句生成AUTO_INCREMENT修饰的列的值时获取一下这个轻量级锁,然后生成本次插入语句需要用到的 AUTO_INCREMENT列的值之后,就把该轻量级锁释放掉,并不需要等到整个插入语句执行完才释放锁。
如果我们的插入语句在执行前就可以确定具体要插入多少条记录,比方说我们上边举的关于表 t 的例子中,在语句执行前就可以确定要插入2条记录,那么一般采用轻量级锁的方式对 AUTO_INCREMENT 修饰的列进行赋值。这种方式可以避免锁定表,可以提升插入性能。
2. InnoDB中的行级锁(重点)
行锁,也称为记录锁 ,顾名思义就是在记录上加的锁。InnoDB把行锁分成了各种类型。换句话说即使对同一条记录加行锁 ,如果类型不同,起到的功效也是不同的。为了方便讲解,我们依然先创建一个表:
CREATE TABLE hero (
number INT,
name VARCHAR(100),
country varchar(100),
PRIMARY KEY (number),
KEY idx_name (name)
) Engine=InnoDB CHARSET=utf8;
我们主要是想用这个表存储三国时的英雄,然后向这个表里插入几条记录:
INSERT INTO hero VALUES
(1, 'l刘备', '蜀'),
(3, 'z诸葛亮', '蜀'),
(8, 'c曹操', '魏'),
(15, 'x荀彧', '魏'),
(20, 's孙权', '吴');
现在表里的数据就是这样的:
我们把hero表中的聚簇索引的示意图画一下:
当然,我们把B+树的索引结构做了一个超级简化,只把索引中的记录给拿了出来,我们这里只是想强调聚簇索 引中的记录是按照主键大小排序的,并且省略掉了聚簇索引中的隐藏列。现在准备工作做完了,下边我们来看看都有哪些常用的行锁类型。
Record Locks: 我们前边提到的记录锁就是这种类型,也就是仅仅把一条记录锁上,我们称这种锁为正经记录锁。官方的类型名称为:LOCK_REC_NOT_GAP。比方说我们把number值为8的那条记录加一个这个锁的示意图如下:
正经记录锁是有S锁和X锁之分的,我们分别称之为S型正经记录锁和X型正经记录锁,当一个事务获取了一条记录的S型正经记录锁后,其他事务也可以继续获取该记录的S型正经记录锁,但不可以继续获取X型正经记录锁;当一个事务获取了一条记录的X型正经记录锁后,其他事务既不可以继续获取该记录的S型正经记录锁,也不可以继续获取X型正经记录锁。
Gap Locks: 我们说MySQL在REPEATABLE READ隔离级别下是可以解决幻读问题的,解决方案有两种,可以使用 MVCC 方案解决,也可以采用加锁方案解决。但是在使用加锁方案解决时有个大问题,就是事务在第一次执行读取操作时,那些幻影记录尚不存在,我们无法给这些幻影记录加上正经记录锁。不过这难不倒InnoDB,他提出了一种称之为Gap Locks 的锁,官方的类型名称为:LOCK_GAP,我们也可以简称为gap锁。比方说我们把number值为8的那条记录加一个gap锁的示意图如下:
如图中为number值为8的记录加了gap锁 ,意味着不允许别的事务在number值为8的记录前边的间隙插入新记录,其实就是number列的值 (3, 8) 这个区间的新记录是不允许立即插入的。
比方说有另外一个事务再想插入一条number值为4的新记录,它定位到该条新记录的下一条记录的number值为8,而这条记录上又有一个gap锁,所以就会阻塞插入操作,直到拥有这个gap锁的事务提交了之后,number列的值在区间(3, 8)中的新记录才可以被插入。
这个gap锁的提出仅仅是为了防止插入幻影记录而提出的,虽然有共享gap锁和独占gap锁这样的说法, 但是它们起到的作用都是相同的。而且如果你对一条记录加了gap锁(不论是共享gap锁还是独占gap 锁),并不会限制其他事务对这条记录加正经记录锁或者继续加gap锁,再强调一遍,gap锁的作用仅仅是为了防止插入幻影记录的而已。
不知道大家发现了一个问题没,给一条记录加了gap锁只是不允许其他事务往这条记录前边的间隙插入新记录,那对于最后一条记录之后的间隙,也就是hero表中number值为20的记录之后的间隙该咋办呢?也就是说给哪条记录加gap锁才能阻止其他事务插入number 值在(20, +∞) 这个区间的新记录呢?
这时候应该想起数据页中的两条伪记录了:
Infimum记录,表示该页面中最小的记录。
Supremum记录,表示该页面中最大的记录。
为了实现阻止其他事务插入number值在 (20, +∞) 这个区间的新记录,我们可以给索引中的最后一条记录,也就是number值为20的那条记录所在页面的Supremum记录加上一个gap锁 ,画个图就是这样:
Next-Key Locks: 有时候我们既想锁住某条记录,又想阻止其他事务在该记录前边的间隙插入新记录,所以InnoDB就提出了一种称之为Next-Key Locks的锁,官方的类型名称为:LOCK_ORDINARY,我们也可以简称为next-key锁 。比方说我们把number值为8的那条记录加一个 next-key锁的示意图如下:
next-key锁的本质就是一个正经记录锁和一个gap锁的合体,它既能保护该条记录,又能阻止别的事务将新记录插入被保护记录前边的间隙。
Insert Intention Locks: 我们说一个事务在插入一条记录时需要判断一下插入位置是不是被别的事务加了所谓的gap锁(next-key 锁也包含gap锁),如果有的话,插入操作需要等待,直到拥有gap锁的那个事务提 交。但是InnoDB规定事务在等待的时候也需要在内存中生成一个锁结构,表明有事务想在某个间隙中插入新记录,但是现在在等待。InnoDB就把这种类型的锁命名为Insert Intention Locks ,官方的类型名称为:LOCK_INSERT_INTENTION,我们也可以称为插入意向锁。比方说我们把number值为8的那条记录加一个插入意向锁的示意图如下:
为了让大家彻底理解这个插入意向锁的功能,我们还是举个例子然后画个图表示一下。比方说现在T1为number值为8的记录加了一个gap锁 ,然后T2和T3分别想向hero表中插入number值分别为4、5的两条记录,所以现在为number 值为8的记录加的锁的示意图就如下所示:
从图中可以看到,由于T1持有gap锁,所以T2和T3需要生成一个插入意向锁的锁结构并且处于等待状态。当T1提交后会把它获取到的锁都释放掉,这样T2和T3就能获取到对应的插入意向锁了(本质上就是把插入意向锁对应锁结构的is_waiting属性改为false),T2和T3之间也并不会相互阻塞,它们可以同时获取到number值为8的插入意向锁 ,然后执行插入操作。事实上插入意向锁并不会阻止别的事务继续获取该记录上任何类型的锁。
隐式锁: 我们前边说一个事务在执行INSERT操作时,如果即将插入的间隙已经被其他事务加了gap锁,那么本次INSERT操作会阻塞,并且当前事务会在该间隙上加一个插入意向锁,否则一般情况下INSERT操作是不加 锁的。那如果一个事务首先插入了一条记录(此时并没有与该记录关联的锁结构),然后另一个事务执行如下操作:
立即使用SELECT … LOCK IN SHARE MODE语句读取这条事务,也就是在要获取这条记录的S锁 ,或者使用SELECT … FOR UPDATE语句读取这条事务或者直接修改这条记录,也就是要获取这条记录的X锁,该咋办? 如果允许这种情况的发生,那么可能产生脏读问题。
立即修改这条记录,也就是要获取这条记录的X锁,该咋办?如果允许这种情况的发生,那么可能产生脏写问题。
这时候事务id又要起作用了。我们把聚簇索引和二级索引中的记录分开看一 下:
情景一:对于聚簇索引记录来说,有一个trx_id隐藏列,该隐藏列记录着最后改动该记录的事务id。那么如果在当前事务中新插入一条聚簇索引记录后,该记录的trx_id隐藏列代表的的就是当前事务的事务id,如果其他事务此时想对该记录添加S锁或者X锁时,首先会看一下该记录的trx_id隐藏列代表的事务是否是当前的活跃事务,如果是的话,那么就帮助当前事务创建一个X锁(也就是为当前事务创建一个锁结构,is_waiting属性是 false),然后自己进入等待状态(也就是为自己也创建一个锁结构,is_waiting属性是true)。
情景二:对于二级索引记录来说,本身并没有trx_id隐藏列,但是在二级索引页面的Page Header部分有一个PAGE_MAX_TRX_ID属性,该属性代表对该页面做改动的最大的事务id ,如果 PAGE_MAX_TRX_ID 属性值小于当前最小的活跃事务id ,那么说明对该页面做修改的事务都已经提交 了,否则就需要在页面中定位到对应的二级索引记录,然后回表找到它对应的聚簇索引记录,然后再重复情景一的做法。通过上边的叙述我们知道,一个事务对新插入的记录可以不显式的加锁(生成一个锁结构),但是由于事务id的存在,相当于加了一个隐式锁。别的事务在对这条记录加S锁或者X锁时,由于隐式锁的存在,会先帮助当前事务生成一个锁结构,然后自己再生成一个锁结构后进入等待状态。
3. InnoDB锁的内存结构
我们前边说对一条记录加锁的本质就是在内存中创建一个锁结构与之关联,那么是不是一个事务对多条记录加锁,就要创建多个锁结构呢?比方说事务T1要执行下边这个语句:
# 事务T1
SELECT * FROM hero LOCK IN SHARE MODE;
很显然这条语句需要为hero表中的所有记录进行加锁,那是不是需要为每条记录都生成一个锁结构呢?其实理论上创建多个锁结构没问题,反而更容易理解,但是如果一个事务要获取10000条记录的锁,要生成10000个这样的结构也太亏了吧!所以InnoDB决定在对不同记录加锁时,如果符合下边这些条件:
在同一个事务中进行加锁操作;
被加锁的记录在同一个页面中;
加锁的类型是一样的;
等待状态是一样的。
那么这些记录的锁就可以被放到一个锁结构中。我们画个图来看看 InnoDB 存储引擎中的锁结构:
我们看看这个结构里边的各种信息都是干嘛的:
锁所在的事务信息: 不论是表锁还是行锁,都是在事务执行过程中生成的,哪个事务生成了这个锁结构,这里就记载着这个事务的信息。
索引信息: 对于行锁来说,需要记录一下加锁的记录是属于哪个索引的。
表锁/行锁信息: 表锁结构和行锁结构在这个位置的内容是不同的:
表锁:记载着这是对哪个表加的锁,还有其他的一些信息。
行锁:记载了三个重要的信息:
Space ID:记录所在表空间。
Page Number:记录所在页号。
n_bits:对于行锁来说,一条记录就对应着一个比特位,一个页面中包含很多记录,用不同的比 特位来区分到底是哪一条记录加了锁。为此在行锁结构的末尾放置了一堆比特位,这个n_bits属性代表使用了多少比特位。
type_mode: 这是一个32位的数,被分成了lock_mode、lock_type和rec_lock_type三个部分,如图所示:
锁的模式(lock_mode),占用第4位,可选的值如下:
LOCK_IS(十进制的 0):表示共享意向锁,也就是IS锁。
LOCK_IX(十进制的 1):表示独占意向锁,也就是IX锁。
LOCK_S(十进制的 2):表示共享锁,也就是S锁。
LOCK_X(十进制的 3):表示独占锁,也就是X锁。
LOCK_AUTO_INC(十进制的 4):表示 AUTO-INC锁 。
锁的类型(lock_type),占用第5~8位:
LOCK_TABLE(十进制的 16),也就是当第5个比特位置为1时,表示表级锁。
LOCK_REC(十进制的 32),也就是当第6个比特位置为1时,表示行级锁。
行锁的具体类型(rec_lock_type),使用其余的位来表示。只有在 lock_type的值为LOCK_REC时, 也就是只有在该锁为行级锁时,才会被细分为更多的类型:
LOCK_ORDINARY(十进制的 0):表示next-key锁。
LOCK_GAP(十进制的 512):也就是当第10个比特位置为1时,表示 gap锁。
LOCK_REC_NOT_GAP(十进制的 1024 ):也就是当第11个比特位置为1时,表示 正经记录锁 。
LOCK_INSERT_INTENTION(十进制的 2048):也就是当第12个比特位置为1时,表示插入意向锁。
其他的类型:还有一些不常用的类型我们就不多说了。
LOCK_WAIT(十进制的 256):也就是当第9个比特位置为1时,表示 is_waiting为true,也就是当前事务尚未获取到锁,处在等待状态;当这个比特位为0时,表示is_waiting为false,也就是当前事务获取锁成功。
注意:在InnoDB存储引擎中,LOCK_IS,LOCK_IX,LOCK_AUTO_INC都算是表级锁的模式,LOCK_S 和LOCK_X既可以算是表级锁的模式,也可以是行级锁的模式。
其他信息: 为了更好的管理系统运行过程中生成的各种锁结构而设计了各种哈希表和链表。
一堆比特位: 如果是行锁结构的话,在该结构末尾还放置了一堆比特位,比特位的数量是由上边提到的n_bits属性表示的。我们知道,页面中的每条记录在记录头信息中都包含一个heap_no属性,伪记录Infimum的 heap_no值为0,Supremum的heap_no值为1,之后每插入一条记录, heap_no值就增1。锁结构最后的一堆比特位就对应着一个页面中的记录,一个比特位映射一个heap_no,不过为了编码方便,映射方式如下所示:
我们还是举个例子说明一下。比方说现在有两个事务T1和T2想对hero 表中的记录进行加锁,hero表中记录比较少,假设这些记录都存储在所在的表空间号为67,页号为3的页面上,那么如果:
T1想对number值为15 的这条记录加S型正常记录锁,在对记录加行锁之前,需要先加表级别的IS锁,也就是会生成一个表级锁的内存结构,接下来分析一下生成行锁结构的过程:
-
事务T1要进行加锁,所以锁结构的锁所在事务信息指的就是T1。
-
直接对聚簇索引进行加锁,所以索引信息指的其实就是PRIMARY索引。
-
由于是行锁,所以接下来需要记录的是三个重要信息:
Space ID:表空间号为67。
Page Number:页号为3。
n_bits:我们的hero表中现在只插入了5条用户记录,但是在初始分配比特位时会多分配一些, 这主要是为了在之后新增记录时不用频繁分配比特位。其实计算n_bits有一个公式:n_bits = (1 + ((n_recs + LOCK_PAGE_BITMAP_MARGIN) / 8)) * 8 其中n_recs指的是当前页面中一共有多少条记录(算上伪记录和在垃圾链表中的记录),比方说现在hero表一共有7条记录(5条用户记录和2条伪记录,所以n_recs的值就是7, LOCK_PAGE_BITMAP_MARGIN 是一个固定的值 64 ,所以本次加锁的n_bits值就是:n_bits = (1 + ((7 + 64) / 8)) * 8 = 72
type_mode是由三部分组成的:
lock_mode,这是对记录加 S锁 ,它的值为 LOCK_S。 lock_type,这是对记录进行加锁,也就是行锁,所以它的值为 LOCK_REC。 rec_lock_type,这是对记录加正经记录锁 ,也就是类型为 LOCK_REC_NOT_GAP的锁。另外,由于当前没有其他事务对该记录加锁,所以应当获取到锁,也就是LOCK_WAIT代表的二进制位应该是0。
综上所述,此次加锁的type_mode的值应该是:
type_mode = LOCK_S | LOCK_REC | LOCK_REC_NOT_GAP
也就是:type_mode = 2 | 32 | 1024 = 1058
- 其他信息 略~
- 一堆比特位:因为number值为15的记录heap_no值为5 ,根据上边列举的比特位和heap_no的映射图来看,应该是第一个字节从低位往高位数第6个比特位被置为1,就像这样:
综上所述,事务T1为number 值为5的记录加锁生成的锁结构就如下图所示:
T2 想对number值为3、8、15的这三条记录加X型的next-key锁,在对记录加⾏锁之前,需要先加表级别的 IX 锁,也就是会⽣成⼀个表级锁的内存结构。
现在 T2要为3条记录加锁, number为3 、8的两条记录由于没有其他事务加锁,所以可以成功获取这条记录的X型next-key锁,也就是⽣成的锁结构的is_waiting属性为false;但是number为15的记录已经被T1加了S 型正经记录锁, T2是不能获取到该记录的X型next-key锁的,也就是⽣成的锁结构的is_waiting属性为true。因为等待状态不相同,所以这时候会⽣成两个锁结构。这两个锁结构中相同的属性如下:
-
事务 T2 要进⾏加锁,所以锁结构的锁所在事务信息指的就是 T2 。
-
直接对聚簇索引进⾏加锁,所以索引信息指的其实就是PRIMARY 索引。
-
由于是⾏锁,所以接下来需要记录三个重要信息:
Space ID:表空间号为 67。
Page Number:⻚号为 3。
n_bits:此属性⽣成策略同T1中⼀样,该属性的值为 72。
type_mode是由三部分组成的:
lock_mode,这是对记录加 X 锁,它的值为 LOCK_X。 lock_type,这是对记录进⾏加锁,也就是⾏锁,所以它的值为 LOCK_REC。 rec_lock_type,这是对记录加next-key锁,也就是类型为LOCK_ORDINARY的锁。
不同的属性如下:
-
为 number 为 3 、 8 的记录⽣成的锁结构:
type_mode值。由于不可以获取到锁,所以is_waiting属性为 false,也就是LOCK_WAIT代表的⼆进制位被置0。所以:
type_mode = LOCK_X | LOCK_REC |LOCK_ORDINARY
也就是
type_mode = 3 | 32 | 0 = 35
-
⼀堆⽐特位:因为 number 值为 3 、8的记录heap_no值分别为3 、4,根据上边列举的⽐特位和heap_no的映射图来看,应该是第⼀个字节从低位往⾼位数第4、5个⽐特位被置为1,就像这样:
综上所述,事务T2为number值为3 、8两条记录加锁⽣成的锁结构就如下图所示:
为number为15的记录⽣成的锁结构:
- type_mode 值。由于不可以获取到锁,所以is_waiting属性为true ,也就是LOCK_WAIT代表的⼆进制位被置1。所以: type_mode = LOCK_X | LOCK_REC |LOCK_ORDINARY | LOCK_WAIT
也就是 type_mode = 3 | 32 | 0 | 256 = 291 - ⼀堆⽐特位:因为number值为15的记录heap_no值为5 ,根据上边列举的⽐特位和heap_no的映射图来看,应该是第⼀个字节从低位往⾼位数第6个⽐特位被置为1,就像这样:
综上所述,事务T2为number值为15的记录加锁⽣成的锁结构就如下图所示:
综上所述,事务T1先获取number值为15的S型正经记录锁,然后事务 T2 获取 number 值为 3、 8、15的X型正经记录锁共需要⽣成3个锁结构。
好了,今天就讲到这里了,到此#从根上理解mysql专栏也就结束了,最后在此声明一下,本专栏是是作者按照下面这本书来写的。
大家如果想要这本书的电子版可以私信我啊。也希望大家能给作者点个关注,谢谢大家!最后依旧是请各位老板有钱的捧个人场,没钱的也捧个人场,谢谢各位老板!