聊聊select for update到底加了什么锁

news2024/11/26 9:35:12

前言

最近在开发需求的时候,用到了select...for update。在代码评审的时候,一位同事说 ,唯一索引+一个非索引字段,是否可能会锁全表呢?本文田螺哥将通过9个实验操作的例子,给大家验证select...for update到底加了什么锁,是表锁还是行锁

这是本文的提纲哈:

图片

因为加锁是跟数据库的隔离级别息息相关的。而常用的数据库隔离级别也就RC(读已提交)和RR(可重复读),所以本文分别根据RC(读已提交) 和 RR(可重复读)隔离级别展开讲述。

1. 环境准备

设置数据库隔隔离级别

mysql> set global TRANSACTION ISOLATION level read COMMITTED;
Query OK, 0 rows affected (0.00 sec)

mysql> select @@transaction_isolation;
+-------------------------+
| @@transaction_isolation |
+-------------------------+
| READ-COMMITTED          |
+-------------------------+
1 row in set (0.00 sec)

自动提交关闭

mysql> set @@autocommit=0;  //设置自动提交关闭
Query OK, 0 rows affected (0.00 sec)

mysql> select @@autocommit;
+--------------+
| @@autocommit |
+--------------+
|            0 |
+--------------+
1 row in set (0.00 sec)

建表语句

CREATE TABLE `user_info_tab` (
  `id` int NOT NULL AUTO_INCREMENT,
  `user_name` varchar(255) DEFAULT NULL,
  `age` int DEFAULT NULL,
  `city` varchar(255) DEFAULT NULL,
  `status` varchar(4) NOT NULL DEFAULT '0',
  PRIMARY KEY (`id`),
  UNIQUE KEY `idx_user_name` (`user_name`) USING BTREE
) ENGINE=InnoDB AUTO_INCREMENT=1570072 DEFAULT CHARSET=utf8mb3;

初始化数据(接下来的实验证明,都是基于这几条初始数据)

insert into user_info_tab(`user_name`,`age`,`city`,`status`) values('杰伦',18,'深圳','1');
insert into user_info_tab(`user_name`,`age`,`city`,`status`) values('奕迅',26,'湛江','0');
insert into user_info_tab(`user_name`,`age`,`city`,`status`) values('俊杰',28,'广州','1');

MYSQL 版本

mysql> select @@version;  
+-----------+
| @@version |
+-----------+
| 8.0.31    |
+-----------+
1 row in set (0.00 sec)

2.RC 隔离级别

2.1 RC隔离级别 + 唯一索引

先把隔离级别设置为RC,因为user_name为唯一索引,我们使用user_name为条件去执行select......for update语句,然后开启另外一个事务去更新数据同一条数据,发现被阻塞了。如下图:

图片

事务二的更新语句为什么会阻塞呢?

因为事务一的select......for update已经加了锁。那加的是行锁还是表锁呢?如果加的是表锁的话,我们更新其他行的记录的话,应该是也会阻塞的,如果是行锁的话,更新其他记录是可以顺利执行的。

大家可以再看下这个图:

图片

通过实验,可以发现:如果事务中是更新其他行记录的话,是可以顺利执行的。因此在RC隔离级别下,如果条件是唯一索引,那么select...for update加的应该是行锁

有些小伙伴会很好奇,到底加了什么锁呢? 接下来带大家看看,具体加的是什么锁。

我用的MySQL版本是8.0+,用这个语句查看:

SELECT * FROM performance_schema.data_locks\G;

如下图,select * from user_info_tab where user_name ='杰伦' for update语句一共加了三把锁,分别是 IX意向排他锁(表级别的锁,不影响插入)、两把X排他锁(行锁,分别对应唯一索引,主键索引)

图片

有些读者朋友说,这里不是加了IX表锁嘛?为什么不阻塞其他行的更新? 其实这个是意向排他锁

意向排他锁:简称IX锁,当事务准备在某条记录上加上X锁时,需要在表级别加一个IX锁。如select ... for update,要给表设置IX锁;

那既然有表锁,为啥事务二在执行其他行的更新语句时,并不会阻塞,这是因为:意向锁仅仅表明意向的锁,意向锁之间不会互斥,是可以并行的。,锁的兼容性如下:

图片

有些小伙伴可能还有疑问,为啥会有两把的X锁呢? 不是都锁住的是同一行嘛?其实RC隔离级别下,唯一索引的加锁是这样的:

图片

为什么不是唯一索引上加X锁就可以了呢?为什么主键索引上的记录也要加锁呢?

如果并发的一个SQL,通过唯一索引条件,来更新主键索引update user_info_tab set user_name = '学友' where id = '1570068';此时,如果select...for update语句没有将主键索引上的记录加锁,那么并发的update就会感知不到select...for update语句的存在,违背了同一记录上的更新/删除需要串行执行的约束。

2.2 RC 隔离级别 + 主键

RC 隔离级别下,如果select...for update的查询条件是主键id,加的又是什么锁呢?

我们执行语句:select * from user_info_tab where id ='1570070' for update;然后开启另外一个事务去更新数据同一条数据,发现被阻塞了。如下图:

图片

事务二更新的是其他行的记录,则是可以顺利执行的,如下图:

图片

通过实验,可以发现:

如果事务中是更新其他行记录,是可以顺利执行的话。在RC隔离级别下,如果条件是主键,那么select...for update锁的也是行

根据2.1小节的结论,select...for update都会加个表级别的IX意向排他锁。所以,查询条件是id的话,select...for update会加两把锁,分表是IX意向排他锁(表锁,不影响插入)一把X排他锁(行锁,对于主键索引)

我们执行语句,查询一下到底加的是什么锁。

begin;
select * from user_info_tab where id ='1570070' for update;
SELECT * FROM performance_schema.data_locks\G;

图片

因此在RC隔离级别下,如果条件是主键,那么select......for update加的就是两把锁,一把IX意向排他锁(不影响插入),一把对应主键的X排他锁(行锁,会锁住主键索引那一行)。

2.3 RC 隔离级别 + 普通索引

RC 隔离级别下,如果select......for update的查询条件是普通索引,加的又是什么锁呢?

我们这里先给原来表加上普通索引:

alter table user_info_tab add index idx_city (city);

我们执行语句:select * from user_info_tab where city ='广州' for update;然后开启另外一个事务去更新同一条数据,发现被阻塞了。如下图:

图片

如果事务二更新的是其他行的记录,还是可以顺利执行的,如下图:

图片

我们看一下select * from user_info_tab where city ='广州' for update;到底加了什么锁,如下图:

图片

发现一共加了三把锁,分别是:IX意向排他锁(表锁)两把X排他锁(行锁,分别对应普通索引的X锁,对应主键的X锁)

如果查询条件,没有命中数据库表的记录又加什么锁呢?

我们把查询条件改一下:select * from user_info_tab where city ='广州' and status='0' for update;

图片

发现只加了一把锁,即IX意向排他锁(表锁,不影响插入)

2.4 RC 隔离级别 + 无索引

RC 隔离级别下,如果select...for update的查询条件是无索引呢,加的又是什么锁呢?

多数读者凭感觉都是锁表了,我们来验证一下。

我们执行语句:select * from user_info_tab where age ='26' for update;(age是没有加索引的),然后开启另外一个事务去更新数据。如下图:

图片

由上图可以发现,事务一 先执行select......for update,然后事务二先更新别的行,发现可以顺利执行,如果执行for update的同一行,还是会阻塞等待

可推出结论,select...for update的查询条件是无索引,主要还是行锁。我们看下具体的加锁情况:

SELECT * FROM performance_schema.data_locks\G;

图片

发现一共加了两把锁,分别是:IX意向排他锁(表锁)一把X排他锁(行锁,对应主键的X锁)

为什么不是一个锁表的X锁呢? 这是因为:

age列上没有索引,MySQL会走聚簇(主键)索引进行全表扫描过滤。每条记录都会加上X锁。但是,为了效率考虑,MySQL在这方面进行了改进,在扫描过程中,若记录不满足过滤条件,会进行解锁操作。同时优化违背了2PL原则。

3.RR 隔离级别

3.1  RR隔离级别 + 唯一索引

如果是RR(可重复)的数据库隔离级别呢,select...for update的查询条件是唯一索引的话,加的又是什么锁呢?

我们知道RR隔离级别RC隔离级别,主要差异还是有间隙锁这个概念。接下来我们还是通过实验去验证,先把数据库隔离级别设置为RR

mysql> set global transaction isolation level repeatable read; (设置完好像要重启一下)

Query OK, 0 rows affected (0.00 sec)

我们执行语句:select * from user_info_tab where user_name ='杰伦' for update;user_name是唯一索引的),然后开启另外一个事务去更新数据。如下图:

图片

由上图可以发现,即使是RR数据库隔离级别,事务一先执行select...for update,然后事务一先更新别的行,发现可以顺利执行,如果执行更新for update的那一行,还是会阻塞超时

再去看下具体加了什么锁:

图片

大家可以发现,不管是RC隔离级别还是RR隔离级别select...for update,查询条件是唯一索引,命中数据库表记录时,一共会加三把锁:一把IX意向排他锁 (表锁,不影响插入),一把对应主键的X排他锁(行锁),一把对应唯一索引的X排他锁 (行锁)

3.2 RR 隔离级别 + 主键

如果是 RR(可重复读)的数据库隔离级别,select...for update的查询条件是主键的话,加的又是什么锁呢?

根据前面的实验结果,我们其实可以推测得出来了,应该跟RC隔离级别一样,会加两把锁:一把IX意向排他锁(表锁,不影响插入),一把对应主键的X排他锁(行锁,影响对应主键那一行的插入)。

我们通过语句确认一下,先输入一下语句:

begin;
select * from user_info_tab where id ='1570070' for update;
SELECT * FROM performance_schema.data_locks\G;

大家可以看下,跟我们的推测是一样的:

图片

3.3 RR 隔离级别 + 普通索引

在RR隔离级别下,如果select...for update的查询条件是普通索引的话,除了会加X锁,IX锁,还会加Gap 锁

Gap锁的提出,是为了解决幻读问题引入的,它是一种加在两个索引之间的锁。

我们来验证一下,先开始事务一,执行一下操作:

begin;
select * from user_info_tab where city ='广州' for update;

接着开启事务二

begin;
insert into user_info_tab(`user_name`,`age`,`city`,`status`) values('方燕',27,'汕头','1');

验证流程图如下:

图片

大家可以发现,插入新记录,会被阻塞,那是因为有间隙锁的缘故,我们再看下到底加了哪些锁:

图片

发现相对于RC隔离级别,确实多了间隙锁,锁住范围了。我画一下这种场景的加锁示意图:

图片

如果要插入汕头城市的记录,会被Gap锁锁住了,因此会阻塞。

因此,在RR隔离级别下,如果select...for update的查询条件是普通索引的话,命中查询记录的话,除了会加X锁(行锁),IX锁(表锁,不影响插入),还会加Gap 锁(间隙锁,会影响插入)

3.4  RR隔离级别 + 无索引

在RR隔离级别下,如果select...for update的查询条件是无索引的话,会锁全表嘛?来一起验证一下

我们直接按顺序执行以下这些语句:

begin;
select * from user_info_tab where age ='26' for update;
select OBJECT_NAME,INDEX_NAME, LOCK_TYPE,LOCK_MODE, LOCK_STATUS, LOCK_DATA FROM performance_schema.data_locks;

可以发现加了这么多锁:

图片

一共把锁,这个IX锁(表级别,意向排他锁),我们可以理解,跟前面几个例子的一样。后面三把行锁,就是把每一行的数据记录,都加了X排他锁(行锁,锁的对象对应于主键Id),我们也可以理解。但是这个第二行,是一把怎么样的X锁呢?

图片

我谷歌了一下,什么是supremum pseudo-record,找到了这个解释:

For the last interval, the next-key lock locks the gap above the largest value in the index and the “supremum” pseudo-record having a value higher than any value actually in the index. The supremum is not a real index record, so, in effect, this next-key lock locks only the gap following the largest index value.

翻译过来,大概意思就是:相当于比索引中所有值都大,但却不存在索引中,相当于最后一行之后的间隙锁。我理解就是如果查询条件有索引的话,类似于一个(索引最大值,+无穷)的虚拟间隙锁。

但是因为我们的查询字段age并没有索引,锁为X锁,lock_data值为supremum pseudo-record,它表示:全表行锁要走聚簇索引进行全部扫描

也就是说RR隔离级别下,对于select...for update查询条件无索引的话,会加一个IX锁(表锁,不影响插入),每一行实际记录行的X锁,还有对应于supremum pseudo-record虚拟全表行锁。这种场景,通俗点讲,其实就是锁表了

我们来做个实验,验证虚拟全表行锁的存在,先开启事务一,执行:

begin;
select * from user_info_tab where age ='26' for update;

然后开启事务二,执行一个插入语句:

begin;
insert into user_info_tab(id,`user_name`,`age`,`city`,`status`) values(1,'小明',31,'北京','1');

大家可以看下,阻塞了,:

图片

加餐

大家有没有发现,田螺哥列举RR数据库隔离级别的例子,select...for update条件都是命中数据库表记录的。在这里,田螺哥给大家出道题。在RR隔离级别下,如果select...for update的查询条件,没命中当前数据表记录的话,又加什么锁呢?

我们来搞点刺激的,select...for update 搞两个条件:一个唯一索引(user_name) + 一个无索引(status),然后没命中当前数据表记录,你觉得会加什么锁呢?

CREATE TABLE `user_info_tab` (
  `id` int NOT NULL AUTO_INCREMENT,
  `user_name` varchar(255) DEFAULT NULL,
  `age` int DEFAULT NULL,
  `city` varchar(255) DEFAULT NULL,
  `status` varchar(4) NOT NULL DEFAULT '0',
  PRIMARY KEY (`id`),
  UNIQUE KEY `idx_user_name` (`user_name`) USING BTREE,
  KEY `idx_city` (`city`)
) ENGINE=InnoDB AUTO_INCREMENT=1570074 DEFAULT CHARSET=utf8mb3

我们按顺序执行者几条语句:

begin;
select * from  user_info_tab  where user_name ='杰伦'  and status ='0'  for update ;
select OBJECT_NAME,INDEX_NAME, LOCK_TYPE,LOCK_MODE, LOCK_STATUS, LOCK_DATA FROM performance_schema.data_locks;

图片

最后

通过本文,大家学到哪些知识点呢?

  1. select...for update在不同场景,都加了什么锁。

  2. 如何查看一个SQL 加了什么锁 (执行完原生SQL,再执行SELECT * FROM performance_schema.data_lock

  3. 如何手写个死锁 (分别开两个事务,制造锁冲突,文章的例子,好多都是死锁的case)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/760237.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

回归预测 | MATLAB实现Attention-GRU多输入单输出回归预测(注意力机制融合门控循环单元,TPA-GRU)

回归预测 | MATLAB实现Attention-GRU多输入单输出回归预测----注意力机制融合门控循环单元,即TPA-GRU,时间注意力机制结合门控循环单元 目录 回归预测 | MATLAB实现Attention-GRU多输入单输出回归预测----注意力机制融合门控循环单元,即TPA-G…

一篇文章让你搞懂自定义类型---枚举与联合体

3.枚举 枚举顾名思义就是一一列举 把可能的取值一一列举 比如我们现实生活中 一周的星期一到星期日是有限的7天,可以一一列举 性别有:男、女、保密,也可以一一列举 月份有12个月,也可以一一列举 这里就可以使用枚举了 3.3.1 枚举…

JVM系列(5)——类加载过程

一、类的生命周期 加载(Loading)、验证(Verification)、准备(Preparation)、解析(Resolution)、初始化(Initialization)、使用(Using&#xff09…

Lesson3-4:OpenCV图像处理---边缘检测

学习目标 了解Sobel算子,Scharr算子和拉普拉斯算子掌握canny边缘检测的原理及应用 1 原理 边缘检测是图像处理和计算机视觉中的基本问题,边缘检测的目的是标识数字图像中亮度变化明显的点。图像属性中的显著变化通常反映了属性的重要事件和变化。边缘的…

vuex使用/this.$store/分模块的vuex

vuex使用 this.$store.state mutation 简化写法 执行异步行为 actions 简化写法getters vuex分模块 访问子模块中的数据

Python程序编译为动态库pyd进行加密

1. 写一段Python代码 首先敲一段代码,这里在名为data.py的Python文件中写下一个求两数之和的简单函数,函数名为i_sum;需要注意一个问题,除了代码前两行常见内容,第3行添加 # cython: language_level3,以在…

【JMeter】四种参数化实现方式是什么?

1 参数化释义 什么是参数化?从字面上去理解的话,就是事先准备好数据(广义上来说,可以是具体的数据值,也可以是数据生成规则),而非在脚本中写死,脚本执行时从准备好的数据中取值。 参…

【大模型】ChatGLM2-6B

参考 清华开源ChatGLM2-6B安装使用 手把手教程,轻松掌握 相关链接 代码:https://github.com/THUDM/ChatGLM2-6B 模型:https://huggingface.co/THUDM/chatglm2-6b、https://cloud.tsinghua.edu.cn/d/674208019e314311ab5c/?p%2Fchatglm2-6b&…

LiNux + 腾讯云 部署项目

1、介绍 Linux本地部署项目华为云简介腾讯云(CVM)远程部署CMS 2、Linux本地部署 2.1、引入 2.2、上传所需文件 文件里已经为大家准备了所需文件了: 在window上使用xftp工具,将linux版本的Jdk、tomcat、Mysql等软件上传至linux…

【电路原理学习笔记】第3章:欧姆定律:3.5 故障排查

第3章:欧姆定律 3.5 故障排查 故障排查是运用逻辑思维,结合对电路或习题运行的全面来纠正故障。故障排查的基本方法包括3个步骤:分析、规划和测量,将这三步方法称为APM。 3.5.1 分析 排查电路故障的第一步是分析故障的线索或症…

java项目之弹幕视频网站(ssm+mysql+jsp)

风定落花生,歌声逐流水,大家好我是风歌,混迹在java圈的辛苦码农。今天要和大家聊的是一款基于ssm的弹幕视频网站。技术交流和部署相关看文章末尾! 目录 开发环境: 后端: 前端: 数据库&…

操作系统练习:创建内核模块,并加载和卸载模块

说明 本文记录如何创建和编译一个内核模块,以及加载和卸载内核模块。为《操作系统概念(第九版)》第二章,关于“Linux内核模块”的练习题。 创建内核模块 注:我这里是基于阿里云的轻量应用服务器(即当前博客服务器) 首…

JS混淆原理

JS混淆原理 •eval 加密 通过eval去执行函数通常和webpack打包拼接一起使用• 变量混淆 ​ 变量名混淆,十六进制替换,随机字符串替换• 属性加密 ​ 一套组合算法,将属性加密生成• 控制流平坦化 逻辑处理块统一加上前驱逻辑块&#xff0c…

最近写了一个Python知识分享网,开源了

大家好,我是锋哥! 项目简介 肝了一周,Python知识分享网上线发布了。www.python222.com 虽然2很多,但是这个网站一点都不二,网站主要分享一些Python相关的技术知识,技术资源以及后面我的Python相关干货课程…

C# Modbus通信从入门到精通(9)——Modbus RTU(0x0F功能码)

1、0F(0x0F)写单个寄存器输出 使用该功能码能将一个寄存器的值写入到远程地址中。 2、发送报文格式 更详细的格式如下: 从站地址+功能码+线圈起始地址高字节+线圈起始地址低字节++线圈数量高字节+线圈数量低字节+字节计数+输出值最高字节+…+输出值最低字节+CRC,其中CRC是…

Linux学习之数组

数组可以存储同一类型的值,定义数组的常见方式是数组名(变量1 变量2 变量3......变量n),使用小括号(圆括号,())括起来,每个变量之间使用空格隔开。比如IPS数组可以存储多个ip变量,定义为IPS(192…

飞书ChatGPT机器人 – 打造智能问答助手实现无障碍交流

文章目录 前言环境列表1.飞书设置2.克隆feishu-chatgpt项目3.配置config.yaml文件4.运行feishu-chatgpt项目5.安装cpolar内网穿透6.固定公网地址7.机器人权限配置8.创建版本9.创建测试企业10. 机器人测试 前言 在飞书中创建chatGPT机器人并且对话,在下面操作步骤中…

设计模式再探-备忘录模式

目录 一、背景介绍二、思路&方案三、过程1.简介,定义2.类图3.符合面向对象的地方4.按照面向对象还可以优化的地方5.扩展-json转化、序列化 四、总结五、升华 一、背景介绍 最近在做一学期的语文课,每一节课结束的时候,需要将这节课上到哪儿了给记录…

SpringBoot使用JWT进行身份验证

JWT身份验证的流程 用户登录: 用户向服务器提供他们的用户名和密码。 服务器验证:服务器接收到请求,验证用户名和密码。 生成JWT:如果用户名和密码验证通过,服务器将创建一个 JWT。 JWT 包含了一些数据(称…

JS混淆原理2023

JS混淆原理 •eval 加密 通过eval去执行函数通常和webpack打包拼接一起使用• 变量混淆 ​ 变量名混淆,十六进制替换,随机字符串替换• 属性加密 ​ 一套组合算法,将属性加密生成• 控制流平坦化 逻辑处理块统一加上前驱逻辑块&#xff0c…