MySQL 升级到 8.0 变慢问题分析

news2024/11/24 16:44:03

1. 背景介绍

前段时间,客户线上 MySQL 版本从 5.7.29 升级到 8.0.25。
升级完成之后,放业务请求进来,没到一分钟就开始出现慢查询,然后,慢查询越来越多,业务 SQL 出现堆积。

整个过程持续了大概一个小时,直到给某条业务 SQL 对应的表加上索引,问题才得到解决。

有一个比较奇怪的现象是:问题持续的过程中,服务器的系统负载、CPU 使用率、磁盘 IO、网络都处于低峰时期的水平,也就是说,问题很可能不是因为硬件资源不够用导致的。

那么,根本原因到底是什么?让我们一起来揭晓答案~

2. 原因分析

客户线上环境有一个监控脚本,每分钟执行一次,这个脚本执行的 SQL 如下:

select ... from sys.innodb_lock_waits w 
inner join information_schema.innodb_trx b
  on b.trx_id = w.blocking_trx_id 
inner join information_schema.innodb_trx r
  on r.trx_id = w.waiting_trx_id;

对几个监控脚本的日志、SAR 日志、MySQL 的慢查询日志 & 错误日志,以及死锁的源码,进行了全方位无死角的分析,发现了可疑之处。

经过测试验证,最终确认罪魁祸首是 sys.innodb_lock_waits 视图引用的某个基表。

这个基表的名字和 MySQL 5.7 中不一样了,它的行为也发生了变化,就是这个行为的变化在某些场景下阻塞了业务 SQL,导致大量业务 SQL 执行变慢。

揭露这个罪恶的基表之前,我们先来看一下 sys.innodb_lock_waits 视图的定义:

  • MySQL 5.7 中简化的视图定义
CREATE VIEW sys.innodb_lock_waits AS
  SELECT ... FROM information_schema.innodb_lock_waits w
  JOIN information_schema.innodb_trx b
    ON b.trx_id = w.blocking_trx_id
  JOIN information_schema.innodb_trx r
    ON r.trx_id = w.requesting_trx_id
  JOIN information_schema.innodb_locks bl
    ON bl.lock_id = w.blocking_lock_id
  JOIN information_schema.innodb_locks rl
    ON rl.lock_id = w.requested_lock_id
  ORDER BY r.trx_wait_started
  • MySQL 8.0 中简化的视图定义
CREATE VIEW sys.innodb_lock_waits (...) AS
  SELECT ... FROM performance_schema.data_lock_waits w 
  JOIN information_schema.INNODB_TRX b 
    ON b.trx_id = w.BLOCKING_ENGINE_TRANSACTION_ID
  JOIN information_schema.INNODB_TRX r
    ON r.trx_id = w.REQUESTING_ENGINE_TRANSACTION_ID
  JOIN performance_schema.data_locks bl
    ON bl.ENGINE_LOCK_ID = w.BLOCKING_ENGINE_LOCK_ID
  JOIN performance_schema.data_locks rl
    ON rl.ENGINE_LOCK_ID = w.REQUESTING_ENGINE_LOCK_ID 
  ORDER BY r.trx_wait_started

5.7 中 sys.innodb_lock_waits 涉及 3 个基表:

  • information_schema.innodb_lock_waits
  • information_schema.innodb_locks
  • information_schema.innodb_trx

8.0 中 sys.innodb_lock_waits 也涉及 3 个基表:

  • performance_schema.data_lock_waits
  • performance_schema.data_locks
  • information_schema.INNODB_TRX

揭晓答案:引发问题的罪魁祸首就是 8.0 中的 performance_schema.data_locks 表。

从两个版本的视图定义对比可以看到,performance_schema.data_locks 的前身是 information_schema.innodb_locks。

我们再来看看这两个表的行为有什么不一样?

MySQL 5.7 中,information_schema.innodb_locks 包含这些数据:

  • InnoDB 事务已申请但未获得的锁。
  • InnoDB 事务已持有并且阻塞了其它事务的锁。

官方文档描述如下:

The INNODB_LOCKS table provides information
about each lock that an InnoDB transaction
has requested but not yet acquired, 
and each lock that a transaction holds
that is blocking another transaction.

MySQL 8.0 中,performance_schema.data_locks 包含这些数据:

  • InnoDB 事务已申请但未获得的锁。
  • InnoDB 事务正在持有的锁。

官方文档描述如下:

The data_locks table
shows data locks held and requested

从官方文档的描述可以看到两个表的不同之处:

  • 5.7 的 innodb_locks 记录 InnoDB 事务已持有并且阻塞了其它事务的锁。
  • 8.0 的 data_locks 记录 InnoDB 事务正在持有的锁。

正是因为这个不同之处,导致 8.0 的 data_locks 表的数据量可能会非常大。

我们再深挖一层,看看 data_locks 表的数据量大是怎么导致其它业务 SQL 阻塞的。

MySQL 线程读取 data_locks 表时,会持有全局事务对象互斥量(trx_sys->mutex),直到读完表中的所有数据,才会释放这个互斥量。

实际上,直到读完表中的所有数据,才会释放 trx_sys->mutex 互斥量的说法不准确。
为了避免展开介绍读取 data_locks 表实现逻辑,我们暂且使用这个说法。

data_locks 表的数据量越大,从表里读取数据花费的时间就越长,读取这个表的线程持有 trx_sys->mutex 互斥量的时间也就越长。

从 data_locks 表里读取数据的线程长时间持有 trx_sys->mutex 互斥量会有什么问题?

这个问题就大了,因为 trx_sys->mutex 互斥量非常吃香。

涉及 InnoDB 的所有 SQL 都在事务中运行,每个事务启动成功之后,都需要加入全局事务链表,而全局事务链表需要 trx_sys->mutex 互斥量的保护。

也就是说,InnoDB 中每个事务加入全局事务链表之前,都需要持有 trx_sys->mutex 互斥量。

从 data_locks 表里读取数据的线程长时间持有 trx_sys->mutex 互斥量,就会长时间阻塞其它 SQL 执行,导致其它 SQL 排队等待,出现堆积,表现出来的状态就是 MySQL 整体都变慢了。

介绍清楚逻辑之后,我们回归现实,来看看客户线上的问题。

  1. 背景介绍小节中提到的那条业务 SQL 在执行过程中会对 300 万条记录加锁。

这条 SQL 只要执行一次,事务结束之前,data_locks 表中会有 300 万条加锁记录。

从 data_locks 表中读取记录之前,需要持有 trx_sys->mutex 互斥量,再读取 300 万条记录,最后释放互斥量。互斥量释放之前,其它业务 SQL 就得排队等着这个互斥量。

监控脚本执行一次的过程中,一堆业务 SQL 只能排队等待 trx_sys->mutex 互斥量,然后到了周期执行时间,监控脚本又执行了一次,也在等待 trx_sys->mutex 互斥量,不幸的是,又来了一堆业务 SQL。

就这样,监控脚本和业务 SQL 相互影响,恶性循环,SQL 执行越来越慢…,直到 DBA 在 1. 背景介绍小节中提到的那条业务 SQL 对应的表上创建了一个索引。

在那个表上创建索引之后,那条业务 SQL 执行过程中就不需要对 300 万条记录加锁了,而是只会对少量记录加锁,data_locks 表中的数据量也就变的很少了,不需要长时间持有 trx_sys->mutex 互斥量,消除了堵点,MySQL 整体就变的通畅了。

3. 测试验证

在 MySQL 5.7 和 8.0 的 test 库中都创建 t1 表,事务隔离级别为:READ-COMMITTED。

表结构如下:

CREATE TABLE `t4` (
  `id` int unsigned NOT NULL AUTO_INCREMENT,
  `e1` enum('长春', '沈阳', '福州', '成都', '杭州', '南昌', '苏州', '德清', '北京') NOT NULL DEFAULT '北京',
  `i1` int unsigned NOT NULL DEFAULT '0',
  `c1` char(11) DEFAULT '',
  `d1` decimal(10,2) DEFAULT NULL,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb3

数据如下:
在这里插入图片描述

3.1 MySQL 5.7 测试
第 1 步,在 session 1 中执行一条 SQL,锁住全表记录:

mysql> begin;
Query OK, 0 rows affected (0.00 sec)

mysql> select * from test.t1
    -> for update;
+----+--------+-------+---------------+------------+
| id | e1     | i1    | c1            | d1         |
+----+--------+-------+---------------+------------+
|  1 | 长春   | 99999 | 1 测试char    | 1760407.11 |
|  2 | 沈阳   |     2 | 2 测试char    | 3514530.95 |
|  3 | 福州   |     3 | 3 测试char    | 2997310.90 |
|  4 | 成都   |     4 | 4 测试char    | 8731919.55 |
|  5 | 杭州   |     5 | 5 测试char    | 2073324.31 |
|  6 | 南昌   |     6 | 6 测试char    | 3258837.89 |
|  7 | 苏州   |     7 | 7 测试char    | 2735011.35 |
|  8 | 德清   |     8 | 8 测试char    |  145889.60 |
|  9 | 杭州   |     9 | 9 测试char    | 2028916.63 |
| 10 | 北京   |    10 | 10 测试char   | 3222960.80 |
+----+--------+-------+---------------+------------+
10 rows in set (0.00 sec)

第 2 步,在 session 2 中,执行另一条 SQL:

mysql> select * from test.t1
    -> where id >= 5
    -> for update;

第 3 步,session 2 的 SQL 等待获取锁的过程中,在 session 3 中查询锁的情况:

mysql> select * from information_schema.innodb_lock_waits;
+-------------------+-------------------+-----------------+------------------+
| requesting_trx_id | requested_lock_id | blocking_trx_id | blocking_lock_id |
+-------------------+-------------------+-----------------+------------------+
| 263231            | 263231:473:3:6    | 263229          | 263229:473:3:6   |
+-------------------+-------------------+-----------------+------------------+
1 row in set, 1 warning (0.04 sec)

mysql> select
    ->  lock_id, lock_trx_id, lock_table, lock_data
    -> from information_schema.innodb_locks;
+----------------+-------------+-------------+-----------+
| lock_id        | lock_trx_id | lock_table  | lock_data |
+----------------+-------------+-------------+-----------+
| 263231:473:3:6 | 263231      | `test`.`t1` | 5         |
| 263229:473:3:6 | 263229      | `test`.`t1` | 5         |
+----------------+-------------+-------------+-----------+
2 rows in set, 1 warning (0.01 sec)

从 innodb_lock_waits 的查询结果可以看到,事务 263231 申请持有锁被事务 263229 阻塞了。

innodb_locks 表中有 2 条记录:

  • lock_trx_id = 263231, lock_data = 5 的记录表示事务 263231 正在申请对 id = 5
    的记录加锁。
  • lock_trx_id = 263229,lock_data = 5 的记录表示事务 263229 正在持有 id = 5
    的记录上的锁,阻塞了事务 263231 对 id = 5 的记录加锁。

这和官方文档对 innodb_locks 表的行为的描述一致(前面已介绍过)。

3.2 MySQL 8.0 测试
第 1 步,在 session 1 中执行一条 SQL,锁住全表记录:

mysql> begin;
Query OK, 0 rows affected (0.00 sec)

mysql> select * from test.t1
    -> for update;
+----+--------+-------+---------------+------------+
| id | e1     | i1    | c1            | d1         |
+----+--------+-------+---------------+------------+
|  1 | 长春   | 99999 | 1 测试char    | 1760407.11 |
|  2 | 沈阳   |     2 | 2 测试char    | 3514530.95 |
|  3 | 福州   |     3 | 3 测试char    | 2997310.90 |
|  4 | 成都   |     4 | 4 测试char    | 8731919.55 |
|  5 | 杭州   |     5 | 5 测试char    | 2073324.31 |
|  6 | 南昌   |     6 | 6 测试char    | 3258837.89 |
|  7 | 苏州   |     7 | 7 测试char    | 2735011.35 |
|  8 | 德清   |     8 | 8 测试char    |  145889.60 |
|  9 | 杭州   |     9 | 9 测试char    | 2028916.63 |
| 10 | 北京   |    10 | 10 测试char   | 3222960.80 |
+----+--------+-------+---------------+------------+
10 rows in set (0.00 sec)

第 2 步,在 session 2 中,执行另一条 SQL:

mysql> select * from test.t1
    -> where id >= 5
    -> for update;

第 3 步,session 2 的 SQL 等待获取锁的过程中,在 session 3 中查询锁的情况:

mysql> select
    ->   engine_transaction_id as trx_id,
    ->   lock_status, lock_data
    -> from performance_schema.data_locks
    -> where lock_type = 'RECORD';
+--------+-------------+-----------+
| trx_id | lock_status | lock_data |
+--------+-------------+-----------+
|  19540 | WAITING     | 5         |
|  19522 | GRANTED     | 1         |
|  19522 | GRANTED     | 2         |
|  19522 | GRANTED     | 3         |
|  19522 | GRANTED     | 4         |
|  19522 | GRANTED     | 5         |
|  19522 | GRANTED     | 6         |
|  19522 | GRANTED     | 7         |
|  19522 | GRANTED     | 8         |
|  19522 | GRANTED     | 9         |
|  19522 | GRANTED     | 10        |
+--------+-------------+-----------+
11 rows in set (0.00 sec)

从以上查询结果可以看到,data_locks 表里包含事务 19522 正在持有的 10 把锁(对应 10 条锁记录),以及事务 19539 已申请但未获得的 id = 5 的记录上的锁,这个行为也和官方文档的描述一致(前面介绍过)。

4. 总结

performance_schema.data_locks 表会记录所有事务正在持有的锁,如果某些 SQL 写的有问题,锁定记录非常多,这个表里的锁记录数量就会非常多。

data_locks 表里的锁记录数量非常多,读取这个表的线程就会长时间持有 trx_sys->mutex 互斥量,这会阻塞其它 SQL 执行。

如果只想要获取锁的阻塞情况,可以查询 performance_schema.data_lock_waits。

本文关键字:#MySQL# #升级# #慢查询#

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/514231.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Java学习笔记 --- Stream流

一、体验Stream流【理解】 案例需求 按照下面的要求完成集合的创建和遍历 创建一个集合,存储多个字符串元素 把集合中所有以"张"开头的元素存储到一个新的集合 把"张"开头的集合中的长度为3的元素存储到一个新的集合 遍历上一步得到的集合 …

使用群晖NAS Mail Server搭建个性化邮件系统

准备工作 一个顶级域名可以获取公网IP的宽带路由使用DDNS功能,或使用群晖自带DDNS,解析顶级域名可以做“端口映射”的路由器 搭建开始 step1:安装套件 登录群晖NAS,打开[套件中心],搜索“mail”,安装如…

idea-easyYapi的使用

链接: EasyYapi官方文档. 网上搜到的easyYapi基本上都是千篇一律,比较浅,稍微有点定制的东西都搜不到,帮此把自己的一些心得写出来,后续有新发现也会继续更新 第一步:安装插件 第二步:配置数据 yapi的t…

运营商大数据助力贷款行业快速精准获取意向客户

流量,是企业发展的一大痛点。随着市场格局不断变化,获取流量越来越成为企业摆脱发展困局的一种重要途径,如何在庞大的市场竞争中,实现自身的流量突破,也成为企业所要解决的首要问题。 贷款行业的竞争也很强烈&#xf…

一文总结MySQL面试知识点

文章目录 知识点1 定位慢查询2 存储引擎3 索引4 SQL优化5 事务6 主从同步7 分库分表 问答题1 如何定位慢查询2 那这个SQL语句执行很慢, 如何分析呢?3 MYSQL支持的存储引擎有哪些, 有什么区别 ?4 了解过索引吗?(什么是索引)5 索引…

录取分数爆降102分,只招一个人也敢报考的狠人!

本期为大家整理热门院校-“华南理工大学”的择校分析,这个择校分析专题会为大家结合:初试复试占比、复试录取规则(是否公平)、往年录取录取名单、招生人数、分数线、专业课难度等进行分析。希望能够帮到大家! –所有数据来源于研…

排班工具小程序开源版开发

排班工具小程序开源版开发 以下是排班工具小程序可能包含的功能列表: 用户注册和登录功能,支持微信登录和手机号登录。排班管理功能,包括创建、编辑、删除和查询排班表。排班表展示功能,支持按天、周、月等不同时间维度展示排班…

Apache DolphinScheduler 开源之夏学生项目申请开启,6 大课题等你来拿万元奖金!

开源之夏 2023 学生报名已经正式开启!Apache DolphinScheduler 今年继续参与开源之夏的活动,2023 年 4 月 29 日-6 月 3 日 15:00 UTC8,同学们可以在开源之夏官网 https://summer-ospp.ac.cn/ 找到 Apache DolphinScheduler 下的项目&#xf…

i春秋 Misc Web 爆破-2

审计一下代码,和爆破-1的区别是,没有了正则匹配,且可变变量$$a变成了普通变量$a; 尝试像爆破-1那样传入超全局变量$GLOBALS 根据回显,我们发现flag不在变量中(它还嘲笑我们“too young too simple”太年轻…

后端注册表单验证器实现

视图函数在去注册用户之前需要进行验证,表单验证需要先下载 flask-wtf 在终端执行: pip install flask-wtf新建forms.py import wtforms from wtforms.validators import Email,Length,EqualTo from models import UserModel,EmailCaptchaModel# Form…

详细的步骤在VirtualBox 上安装 CentOS 7

下面是详细的步骤来安装 CentOS 7 在 VirtualBox 上: 下载 CentOS 7 ISO 镜像文件: 前往 CentOS 官方网站的镜像下载页面:Download在页面上找到适合你系统架构的 CentOS 7 ISO 镜像文件,并下载到本地。 安装 VirtualBox&#x…

为什么大部分企业都选择加密软件来防止数据泄露?

加密软件是使用加密算法对数据或信息进行编码转换的软件,目的是防止未授权访问与保护敏感内容。它是实现加密技术的重要手段,为用户提供了简单易用的加解密功能,无需深入了解复杂的数学原理。 加密软件使用的加密算法通常采用对称与非对称算法…

16 KVM虚拟机配置-其他常见配置项

文章目录 16 KVM虚拟机配置-其他常见配置项16.1 概述16.2 元素介绍16.3 配置示例 16 KVM虚拟机配置-其他常见配置项 16.1 概述 除系统资源和虚拟设备外,XML配置文件还需要配置一些其他元素,本节介绍这些元素的配置方法。 16.2 元素介绍 iothreads&…

干货丨手把手教会群晖Mailplus设置及邮件免拒收(SPF、DMARC、DKIM)

开篇之前,我想说通过群晖 Mailplus Server 自建一个邮件服务器绝对是一个非常有成就感的事情,搭建 过程中我们可以学习到邮件服务使用的协议,端口号,MX解析等很多知识。如果你已经准备好,那就让 我们开始吧。 前期准备…

前端013_标签模块_新增功能

标签模块_新增功能 1、需求分析2、新增窗口实现3、列表引用新增组件4、关闭弹出窗口5、校验表单数据6、提交表单数据6.1 EasyMock 添加新增模拟接口6.2、Api 调用接口1、需求分析 点击 新增 按钮后,对话框形式弹出新增窗口输入类别信息后,点击 确定 提交表单数据; 2、新增窗…

DARWIN Survival of the Fittest Fuzzing Mutators读论文笔记

DARWIN: Survival of the Fittest Fuzzing Mutators 作者背景 达姆施塔特工业大学:成立于1877年,是德国著名理工科大学 ‡萨格勒布大学: 是克罗地亚最大的大学,也是该地区历史最悠久的大学 拉德堡德大学:位于荷兰奈梅亨市,又称奈梅…

Redis与SpringBoot的集成:自定义RedisTemplate类,创建一个工具类:可以帮助我们更好的使用redis中的API

这里使用的环境是在windows环境下,也可以放在服务器中,只要知道端口号和ip即可,如果有不知道怎么部署环境的可以看这篇文章去在Windows环境下去部署redis环境redis之jedis:通过redis的API与Java的集成_不想睡醒的梦的博客-CSDN博客…

css的clip-path学习

文章目录 clip-path的几个值polygon多边形circle圆形ellipse椭圆形inset 矩形round后面是四个角的度数 一个简单的应用,比如画一段曲线 参考博文 clip-path的几个值 自己学习后,先把clip-path理解为在原图上绘制轮廓,显示的内容是轮廓内的内…

2023苹果商务管理模式分发app完全指南

随着苹果对企业级开发证书的管控越来越严格,越来越多的企业级证书到期后,苹果不再予以续约,但是很多app都有企业内部分发需求,不希望自己的应用被公开上架。这时候,我们可以参考苹果官方的建议,使用商务管理…

繁华三千如梦散,红尘俗世要释怀

岁月的折痕在眼角盛开,一深,一浅,交错着旧时光的梦。 梦里是累积的回忆,厚厚的凌乱一地。 那些,都是悄悄溜走的充满烟火气的日子。 生活像是流水账一般,就这样过了,一天又一天,一年…