MySQL 执行过程

news2025/1/4 16:35:20

MySQL 的执行流程也确实是一个复杂的过程,它涉及多个组件的协同工作,故而在面试或者工作的过程中很容易陷入迷惑和误区。

MySQL 执行过程

本篇将以 MySQL 常见的 InnoDB 存储引擎为例,为大家详细介绍 SQL 语句的执行流程。从连接器开始,一直到事务的提交和数据持久化。

首先,客户端会与 MySQL Server 连接,并发送增删改查语句,Server 收到语句后会创建一个解析树,进行优化。

优化器优化语句时,会评估各种索引的代价,选择合适的索引,然后通过执行器调用 InnoDB 引擎的接口来执行语句。

具体执行流程

1. 连接器(Connection Manager)

MySQL 的执行流程始于连接器。当客户端请求与 MySQL 建立连接时,连接器负责处理这些连接请求。

它验证客户端的身份和权限,然后分配一个线程来处理该连接。MySQL 每个连接线程会创建一个会话(session),在这个会话中,客户端可以发送 SQL 语句进行增删改查等操作。

2. 分析器(Parser)

一旦连接建立,客户端可以发送待执行的 SQL 语句。

这些 SQL 语句首先被送到分析器,分析器的任务是解析 SQL 语句,确定其语法是否正确,并将其转化为一个内部数据结构,以供 MySQL 后续使用。

如果 SQL 语句有语法错误,分析器将返回错误信息给客户端。

3. 优化器(Optimizer)

一旦 SQL 语句被成功解析,接下来进入优化器的领域。

优化器的任务是评估该 SQL 语句不同的执行计划,并选择最优的执行计划。它会考虑哪些索引可用,哪种连接方法效率最高,以及如何最小化查询的成本。

4. 执行器(Executor)

执行器接收到优化器生成的执行计划后,它开始执行实际的查询操作。

执行器会按照执行计划中的步骤,调用 InnoDB 引擎层的逻辑并从数据表中获取数据,然后进行排序、聚合、过滤等操作。

最终,执行器将结果返回给客户端。

5. 写 undo log

当执行器执行修改数据的操作时,MySQL 的 InnoDB 引擎首先会开启事务,为这些修改生成 undo log(也叫回滚日志)。

回滚日志用于记录修改前的数据,以便在事务回滚时恢复原始数据。如果事务执行失败,MySQL 可以使用undo log 来撤销已经进行的修改。

6. 记录缓存(Record Cache),查找索引

MySQL 使用记录缓存来存储从数据表中读取的数据行,这个缓存可以加速对频繁读取的数据的访问,避免了每次都要从磁盘读取的开销。

当数据存在于内存中时,只需要更新内存即可;反之则可能需要从磁盘中读取数据,再更新磁盘数据。

这取决于 MySQL 的索引类型,可分为两种:

  • 唯一索引:索引列的值唯一,非主键的唯一索引允许有空值,主键索引不允许空值;
  • 普通索引:没有特殊限制,允许重复值和空值;

当 SQL 操作数据到达这一步时,InnoDB 首先会判断数据页是否在内存中:

  • 在内存中,判断更新的索引是否是唯一索引。如果是唯一索引,则判断更新后是否破坏数据的一致性,不会的话就直接更新内存中的数据页;如果是非唯一索引,直接更新内存中的数据页。
  • 不在内存中:判断更新的索引是否是唯一索引。如果是唯一索引,由于需要保证更新后的唯一性,所以需要立即把数据页从磁盘加载到内存,然后更新数据页;如果是非唯一索引,则将数据更新的操作记录到 change buffer,它将在在空闲时异步更新到磁盘。

7. change buffer

change buffer 是 InnoDB 引擎的特性之一,在 MySQL 5.5 之前,change buffer 的主要作用是提高数据插入的性能,又被称作 insert buffer。

我们知道,当非聚集索引插入时,数据会按主键的顺序存放,所以叶子节点可能需要离散地访问数据索引页,每次索引页更新时,都需要刷新磁盘。而每次读写磁盘的时间都会很久,故而导致插入性能较低。

而 insert buffer 开启后,会先判断聚集索引页是否存在于缓冲池中,如果有,直接插入;如果不在,先放入一个插入缓冲区进行排序,再以一定的频率合并(merge)更新索引页。

如图所示,insert buffer 将多次操作合并起来,以减少随机 I/O,减少和磁盘交互的操作,从而提升整体的性能。

MySQL5.5 之后,逐渐加入了数据删除和修改的缓冲类型,统一叫 change buffer。

一言概之,change buffer 主要作用是将二级索引的增删改(IDU)操作缓存下来,以减少随机 I/O,达到操作合并的效果。

由于唯一索引需要立即 IO 到磁盘,以保证数据不冲突,因此唯一索引没有 change buffer 机制。

8. 写 redo log

在 SQL 执行的过程中,InnoDB 还会记录所有的数据修改操作到 redo log(重做日志)中。

重做日志是一个循环写入的日志文件,它记录了事务的每个步骤,以确保数据的持久性。如果系统崩溃, InnoDB 可以根据 redo log 来恢复未提交的事务,以保持数据的一致性。

注意,redo log 分为 prepare 和 commit 两个状态。在事务执行的过程中,InnoDB 把数据页的更改写入到 redo log 时,其状态为 prepare 状态。

9. 写 binlog,提交事务

除了 redo log,MySQL 还会记录 binlog(二进制日志)。

二进制日志记录了所有执行的 SQL 语句,而不仅仅是数据修改,这对于数据复制和恢复非常重要,因为它可以确保不仅数据的状态被恢复,连同执行的 SQL 操作也能被还原。

当 InnoDB 引擎层写好 redo log 后,会通知 MySQL Server 层已将更新操作已经执行完成。这时,MySQL Server 将执行的 SQL 写入到 binlog,然后通知 InnoDB 将 redo log 置为 commit 状态,事务提交成功。

注意,一个事务提交成功的判断依据在于是否写入到 binlog 日志中。若已写入,即便 MySQL Server 崩溃,之后也可以根据 redo log 和 binlog 进行恢复。

redo log 和 binlog

上面说到了,当事务提交时,分为两个阶段,我们总结一下:

  1. 数据更新时,先更新内存中的数据页,将更新操作写入到 redo log 中,此时 redo log 进入 prepare 状态。并通知 MySQL Server 更新执行完了,随时可以提交;
  2. MySQL Server 根据持久化的模式是 STATEMENT 还是 ROW,决定将更新的 SQL 还是数据行写入到 binlog,然后调用 InnoDB 的接口将 redo log 设置为 commit 状态,更新完成。

细心的同学可能会问了,为什么 binlog 只需要提交一次,而 redo 要提交两次?而已经有 redo log了,还需要 binlog 干啥?

要解答这个问题,得从两种日志的本质区别说起。

redo log

用于记录 InnoDB 引擎下事务的日志,支持崩溃数据自修复。

如果只写 binlog,而不写 redo log,当 MySQL 发生故障宕机时,就可能会丢失最近执行的事务数据。

binlog

binlog 记录了 MySQL Server 层对数据库执行的所有更改操作,用于数据归档、数据备份及主从复制等。

如果写了 redo log 直接提交,不经过 prepare 阶段,那么这个过程在发生故障时,如果 MySQL 部署了主从节点,主节点可以根据 redo log 恢复数据,但从节点就无法同步这部分数据。

从上图可以看出,MySQL 主从复制时,主要依赖 Master 节点的 binlog,Slave 节点的 relay-log 和 3 个重要线程。

log dump线程

当从节点连接主节点时,主节点会为其创建一个 log dump 线程,用于读取和发送 binlog 内容。在读取 binlog 中时,log dump 线程会对主节点上的 bin-log 加锁,直到读取完成,锁释放。

主节点会为自己的每一个从节点创建一个 log dump 线程。

I/O线程

当从节点绑定主节点时,会创建一个 I/O 线程用来连接主节点,请求主库中的 binlog。

当主库的 log dump 线程发送的日志被监听到以后,I/O 线程会把日志保存到 relay-log(中继日志)中。

SQL线程

SQL 线程负责监听并读取 relay-log 中的内容,解析成具体的操作并进行重放,使其和主数据库保持一致。每次执行完毕后相关线程会进行休眠,等待下一次唤醒。

从库会在一定时间间隔内探测主库的 bin-log 日志是否发生变化,如有变化,则开启 IO 线程,继续执行上述步骤。

参考:微信公众平台​​​​​​​

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1343422.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

uniapp门店收银,点击右边商品,商品会进入左边的购物车,并且,当扫码枪扫描商品条形码,商品也会累计进入购物车

效果&#xff1a; 代码&#xff1a; <template><view class"container"><view class"top" style"height: 10%; margin-bottom: 20rpx; box-shadow: 0px 2px 4px rgba(0, 0, 0, 0.2);"><view class"box" style&q…

QML 怎么调用 C++ 中的内容?

以下内容为本人的学习笔记&#xff0c;如需要转载&#xff0c;请声明原文链接 微信公众号「ENG八戒」https://mp.weixin.qq.com/s/z_JlmNe6cYldNf11Oad_JQ 先说明一下测试环境 编译器&#xff1a;vs2017x64 开发环境&#xff1a;Qt5.12 这里主要是总结一下&#xff0c;怎么在…

【教学类-43-03】20231229 N宫格数独3.0(n=1、2、3、4、6、8、9) (ChatGPT AI对话大师生成 回溯算法)

作品展示&#xff1a; 背景需求&#xff1a; 大4班20号说&#xff1a;我不会做这种&#xff08;九宫格&#xff09;&#xff0c;我做的是小格子的&#xff0c; 他把手工纸翻过来&#xff0c;在反面自己画了矩阵格子。向我展示&#xff1a;“我会做这种&#xff01;” 原来他会…

MYSQL 深入探索系列六 SQL执行计划

概述 好久不见了&#xff0c;近期一直在忙项目的事&#xff0c;才有时间写博客&#xff0c;近期频繁出现sql问题&#xff0c;今天正好不忙咱们看看千万级别的表到底该如何优化sql。 案例 近期有个小伙伴生产环境收到了告警&#xff0c;有个6千万的日志表&#xff0c;查询耗时大…

YOLO训练results.csv文件可视化(原模型与改进模型对比可视化)

一、单独一个文件可视化&#xff08;源码对应utils文件夹下的plots.py文件的plot_results类&#xff09; from pathlib import Path import matplotlib.pyplot as plt import pandas as pd def plot_results(fileruns/train/exp9/results.csv, dir):# Plot training results.c…

java 企业工程管理系统软件源码+Spring Cloud + Spring Boot +二次开发+ 可定制化

工程项目管理软件是现代项目管理中不可或缺的工具&#xff0c;它能够帮助项目团队更高效地组织和协调工作。本文将介绍一款功能强大的工程项目管理软件&#xff0c;该软件采用先进的Vue、Uniapp、Layui等技术框架&#xff0c;涵盖了项目策划决策、规划设计、施工建设到竣工交付…

机器学习距离度量方法

1. 机器学习中为什么要度量距离&#xff1f; 机器学习算法中&#xff0c;经常需要 判断两个样本之间是否相似 &#xff0c;比如KNN&#xff0c;K-means&#xff0c;推荐算法中的协同过滤等等&#xff0c;常用的套路是 将相似的判断转换成距离的计算 &#xff0c;距离近的样本相…

cdn引入React以及React-dom—数组遍历渲染时setExtraStackFrame报错

在引入react官网提供的cdn后&#xff0c;部分静态页面没有问题&#xff0c;但是使用到 一下循环的页面则会报错。 const devReactCdn [https://unpkg.com/react18/umd/react.development.js,https://unpkg.com/react-dom18/umd/react-dom.development.js, ]; const prodReact…

计算机网络【DHCP动态主机配置协议】

DHCP 出现 电脑或手机需要 IP 地址才能上网。大刘有两台电脑和两台手机&#xff0c;小美有一台笔记本电脑、一台平板电脑和两台手机&#xff0c;老王、阿丽、敏敏也有几台终端设备。如果为每台设备手动配置 IP 地址&#xff0c;那会非常繁琐&#xff0c;一点儿也不方便。特别是…

web前端开发网页制作html/css结课作业

效果图展示&#xff1a; 注意事项&#xff1a; 引用JQuery文件地址和图片地址要更换一下。 百度网盘链接&#xff1a; http://链接&#xff1a;https://pan.baidu.com/s/1wYkmLr7csjBwQY6GmlYm4Q?pwd4332 提取码&#xff1a;4332 html界面展示&#xff1a; main.css代码部…

2023 年中国高校大数据挑战赛赛题B DNA 存储中的序列聚类与比对-解析与参考代码

题目背景&#xff1a;目前往往需要对测序后的序列进行聚类与比对。其中聚类指的是将测序序列聚类以判断原始序列有多少条&#xff0c;聚类后相同类的序列定义为一个簇。比对则是指在聚类基础上对一个簇内的序列进行比对进而输出一条最有 可能的正确序列。通过聚类与比对将会极大…

docker-compose安装及转换为k8s集群部署

docker-compose安装及转换为k8s集群部署 一、docker-compose安装 1、下载 curl -L https://github.com/docker/compose/releases/download/v2.5.0/docker-compose-linux-x86_64 2、指定位置 放入/usr/local/bin/ 路径下&#xff1a; mv docker-compose-linux-x86_64 docke…

pnpm : 无法加载文件 C:\Program Files\nodejs\pnpm.ps1,因为在此系统上禁止运行脚本。

一、问题描述 在VS Code中运行Terminal中运行pnpm install&#xff08;npm或yarn也类似&#xff09;报错&#xff1a; S D:\workspace\xxx\xxx> pnpm install pnpm : 无法加载文件 C:\Program Files\nodejs\pnpm.ps1&#xff0c;因为在此系统上禁止运行脚本。有关详细信息…

K8s陈述式资源管理

命令行&#xff1a;kubectl命令行工具 优点&#xff1a;90%以上的场景都可以满足 对资源的增删改查比较方便&#xff0c;对改不是很友好。 缺点&#xff1a;命令比较冗长&#xff0c;复杂&#xff0c;难记 声明式&#xff1a; 看到声明式都是k8s当中的yml文件来实现资源管理…

基于CNN和双向gru的心跳分类系统

CNN and Bidirectional GRU-Based Heartbeat Sound Classification Architecture for Elderly People是发布在2023 MDPI Mathematics上的论文&#xff0c;提出了基于卷积神经网络和双向门控循环单元(CNN BiGRU)注意力的心跳声分类&#xff0c;论文不仅显示了模型还构建了完整的…

无需翻墙|Stable Diffusion WebUI 安装|AI绘画

前言 最近终于有机会从围墙里往外看&#xff0c;了解到外面的世界已经有了天翻地覆的变化&#xff0c;感叹万千&#xff0c;笔者在本地mac&#xff0c;windows&#xff0c;linux&#xff0c;docker部署了不下20遍后&#xff0c;整理出来的linux极简避坑安装方案&#xff0c;供…

一体化、一站式!智能视频客服加码全媒体云呼叫中心能力

凭借对电话、短信、邮件、社交媒体、视频等数种沟通渠道强大的统一集成能力&#xff0c;全媒体云呼叫中心已跃升成为现代企业客户服务的核心工具&#xff0c;高效便捷地为企业提供客户服务。而随着消费者需求愈加多元化和个性化&#xff0c;传统的语音通话方式已无法满足部分消…

雪花算法(Snowflake)介绍和Java实现

1、雪花算法介绍 (1) 雪花算法(SnowFlake)是分布式微服务下生成全局唯一ID&#xff0c;并且可以做到去中心化的常用算法&#xff0c;最早是Twitter公司在其内部的分布式环境下生成ID的方式。 雪花算法的名字可以这么理解&#xff0c;世界上没有两片完全相同的雪花&#xff0c;…

java爬虫(jsoup)如何设置HTTP代理ip爬数据

目录 前言 什么是HTTP代理IP 使用Jsoup设置HTTP代理IP的步骤 1. 导入Jsoup依赖 2. 创建HttpProxy类 3. 设置代理服务器 4. 使用Jsoup进行爬取 结论 前言 在Java中使用Jsoup进行网络爬虫操作时&#xff0c;有时需要使用HTTP代理IP来爬取数据。本文将介绍如何使用Jsoup设…

认识微服务---Spring Cloud

一、服务架构演变 1、单体架构&#xff1a;将业务的所有功能集中在一个项目开发&#xff0c;打包成一个部署。 优点&#xff1a; 架构简单部署成本低 缺点&#xff1a; 耦合度高不利于大型项目开发 2、分布式架构 &#xff1a;根据业务功能对系统进行拆分&#xff0c;每个…