MySQL之深入InnoDB存储引擎——Checkpoint机制

news2025/1/22 23:00:45

文章目录

    • 一、引入
    • 二、LSN
    • 三、触发时机

一、引入

由于页的操作首先都是在缓冲池中完成的,那么如果一条DML语句改变了页中的记录,那么此时页就是脏的,即缓冲池中页的版本要比磁盘的新。那么数据库需要将新版本的页刷新到磁盘。倘若每次一个页发生变化就刷新,那么开销会很大,若热点数据集中在某几个页中,那么数据库的性能将变得非常差。

同时如果在缓冲池将新版本的页刷新到磁盘时发生了宕机,那么数据就不能恢复了。为了避免发生数据丢失的问题,当前事务数据库普遍都采用了 Write Ahead Log 策略,即当事务提交时,先写重做日志,再修改页。当由于发生宕机而导致数据丢失时,通过重做日志来完成数据的恢复,从而满足事务的持久性要求。

如果说重做日志可以无限地增大,同时缓冲池也足够大,能够缓冲所有数据库的数据,那么是不需要将缓冲池中页的新版本刷回磁盘。因为发生宕机时完全可以通过重做日志来恢复数据库系统的数据到宕机发生的情况。然而现实是这两个条件是很难满足的,即使满足了,那么如果数据库运行了很久后发生宕机,那么使用重做日志进行恢复的时间也会非常的久。即缓冲池的容量和重做日志容量是有限的,所以需要定期将脏页刷回磁盘,在这样的情况下,引入了 Checkpoint(检查点)技术。

所谓 Checkpoint,是指一个触发点(时间点),当发生 Checkpoint 时,会将脏页(数据脏页和日志脏页)写回磁盘。总的来说,Checkpoint 是数据库管理系统中的一个操作,用于将脏页刷新到磁盘,以确保数据的持久性和一致性。

二、LSN

LSN 称为日志的逻辑序列号(log sequence number),是日志空间中每条日志的结束点,用字节偏移量来表示。在 InnoDB 存储引擎中,LSN 占8个字节,LSN 的值会随着日志的写入而逐渐变大。除了重做日志,每个页(在每个数据页的头部 FILE_HEADER 部分,有一个 FIL_PAGE_LSN 记录了该数据页最后被修改的日志序列位置)以及 Checkpoint 也会被分配一个LSN,以便在需要时可以按照顺序进行检索和恢复。

即 Checkpoint 是通过LSN实现,其由一个 LSN 表示,用来记录已经刷回磁盘的最新页的版本

可以通过show engine innodb status来观察 redo log 里的 checkpoint,结果如下:

......
---
LOG
---
Log sequence number          38890249625                                                                                                                                             
Log buffer assigned up to    38890249625                                                                                                                                             
Log buffer completed up to   38890249625                                                                                                                                             
Log written up to            38890249625                                                                                                                                             
Log flushed up to            38890249625                                                                                                                                             
Added dirty pages up to      38890249625                                                                                                                                             
Pages flushed up to          38890249625                                                                                                                                             
Last checkpoint at           38890249625  
......
  • log sequence number 就是当前的 redo log (in buffer) 中的 LSN;

  • log flushed up to 是刷到 redo log file 磁盘数据中的 LSN;

  • pages flushed up to 是下一次即将做 checkpoint lsn 的位置,如果没有新数据写入则取 lsn 的值

    • 因此它的值经常会比 last checkpoint at 大,因为做 checkpoint 时 redo 日志会写 MLOG_CHECKPOINT,其占用9个字节,所以系统 LSN 会加 9
  • last checkpoint at 是上一次检查点所在位置的 LSN。

当我们执行一条修改语句时,InnoDB 存储引擎的执行过程大概如下:

  1. 首先修改内存中的数据页,并在数据页中记录 LSN
  2. 修改数据页的同时向 redo log in buffer 中写入 redo log,并记录下 LSN
  3. 写完 buffer 中的日志之后,当触发了日志刷盘的几种规则时,会向 redo log file on disk 刷入 redo 日志,并在该文件中记录下对应的 LSN,暂且称之为 redo_log_on_disk_lsn
  4. 数据页不可能永远只停留在内存中,在某些情况下,会触发 checkpoint来 将内存中的脏页(数据脏页和日志脏页)刷到磁盘,所以会在本次 **checkpoint 脏页刷盘结束时,在 redo log 中记录 checkpoint 的 LSN 位置。**在 Checkpoint 完成之后,checkpoint LSN 之前的 Redo Log 就不再需要了
  5. 要刷入所有的数据页需要一定的时间来完成,中途刷入的每个数据页都会记下当前页所在的 LSN。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-kapEiKN8-1690440141442)(assets/image-20230727120620-7r0i4f6.png)]

MySQL 在崩溃恢复时,会从重做日志 redo-log 的 Checkpoint 处开始执行重放操作。 它从 last Checkpoint 对应的 LSN 开始扫描 redo-log 日志,并将其应用到 buffer-pool 中,直到 last Checkpoint 对应的 LSN 等于 log flushed up to 对应的 LSN (也就是 redo-log 磁盘上存储的 LSN 值),则恢复完成 。

三、触发时机

Checkpoint 所做的事情无外乎是将缓冲池中的脏页刷回到磁盘,不同之处在于每次刷新多少页到磁盘,每次从哪里获取脏页,以及什么时间触发 Checkpoint。在 InnoDB 内部有两种 Checkpoint,分别为:

  • Sharp Checkpoint
  • Fuzzy Checkpoint

Sharp Checkpoint 发送在数据库关闭时将所有的脏页都刷新回磁盘,这是默认的工作方式,即参数 innodb_fast_shutdown=1。

但是若数据库在运行时也使用 Sharp Checkpoint,那么数据库的可用性就会受到很大影响。所以 InnoDB 存储引擎内部使用 Fuzzy Checkpoint 进行页的刷新,即每次只刷新一部分脏页

InnoDB 存储引擎中可能发生时会触发 Fuzzy Checkpoint:

  • Master Thread Checkpoint:Master Thread 差不多以每秒或每十秒的速度从缓冲池的脏页列表中刷新一定比例的页回磁盘,这个过程是异步的,不会阻塞其他操作。

  • FLUSH_LRU_LIST Checkpoint:Buffer Pool 的 LRU 列表需要保留一定数量的空闲页面,来保证 Buffer Pool 中有足够的空间应对新的数据库请求。在空闲列表不足时,移除LRU列表尾端的页,若移除的页为脏页,则需要进行 Checkpoint。空闲数量阈值是可以配置的(默认是1024),这个检查在一个单独的 Page Cleaner 线程中进行。

  • Async/Sync Flush Checkpoint:当重做日志不可用(即 redo log 写满)时,需要强制将一些页刷新回磁盘,此时脏页从脏页列表中获取。

    • 定义 checkpoint_age = redo_log_in_buffer_lsn - checkpoint_lsn,即有多少脏页还未刷回磁盘
    • 定义 async_water_mark = 0.75 * total_redo_log_file_size,sync_water_mark = 0.9 * total_redo_log_file_size
    • 如果 checkpoint_age < async_water_mark,那么不需要刷新任何脏页回磁盘
    • 如果 async_water_mark < checkpoint_age < sync_water_mark,那么触发 Async Flush,从 Flush 列表刷新足够的脏页回磁盘,以满足checkpoint_age < async_water_mark
    • 如果 checkpoint_age > sync_water(种情况一般很少见,除非设置的重做日志文件太小),那么触发 Sync Flush,从 Flush 列表刷新足够的脏页回磁盘,以满足checkpoint_age < async_water_mark
    • 旧版本中 Async Flush 会阻塞发现问题的用户查询线程,Sync Flush 会阻塞所有查询线程,新版本中在独立的 Page Cleaner Thread 中执行,不会阻塞
  • Dirty Page too much Checkpoint:当脏页数量太多时会强制推进 Checkpoint,以保证缓冲区有足够的空闲页。innodb_max_dirty_pages_pct 的默认值为75,表示当缓冲池脏页比例达到该值时,就会强制进行 Checkpoint,刷新一部分脏页到磁盘。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/801034.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

地图应用构建平台:助力小程序开发者快速构建地图应用

地图应用构建平台&#xff08;也称Wemap Builder&#xff09;是地图低代码开发平台&#xff0c;在微信开发者工具中提供了丰富的小程序模板&#xff0c;开发者能够选择模板快速创建地图应用&#xff0c;同时在微信开发者工具中可直接使用低代码编辑器&#xff0c;更高效的开发小…

力扣算法数学类—剑指 Offer 16. 数值的整数次方

目录 剑指 Offer 16. 数值的整数次方 题解&#xff1a; 知识点&#xff1a; 代码&#xff1a; 结果&#xff1a; 实现 pow(x, n) &#xff0c;即计算 x 的 n 次幂函数&#xff08;即&#xff0c;xn&#xff09;。不得使用库函数&#xff0c;同时不需要考虑大数问题。 示例…

向量数据库这杯“啤酒”与“泡沫”

就像啤酒注定要有泡沫&#xff0c;每一场淘金热都不缺被捧上了时代风口的人。 大模型这一波热潮中&#xff0c;向量数据库就是那个幸运儿。 一方面&#xff0c;技术层面并没有太大突破。向量数据库并不是一种特别新的数据库技术&#xff0c;在AI领域已经应用了七八年&#xff0…

英特尔14代酷睿参数曝光:13代酷睿用户看完放心了 升级幅度有限

今年6月份英特尔进行了品牌升级&#xff0c;宣布新命名规则&#xff0c;预热了酷睿Ultra品牌和第14代酷睿处理器产品线。 代号为Meteor Lake的酷睿Ultra系列虽然备受关注&#xff0c;但令人遗憾的是&#xff0c;它只面向低功耗移动端&#xff0c;预计将包括45W的H系列&#xff…

NLP From Scratch: 使用char-RNN对姓氏进行分类

NLP From Scratch: 使用char-RNN对姓氏进行分类 本篇我们将构建并训练基本的字符级 RNN 来对单词进行分类。 本教程&#xff0c;以及后续两个教程&#xff0c;展示了如何“从头开始”针对 NLP 建模过程中所需的数据进行预处理&#xff0c;抛开torchtext的许多便利功能进行编码…

C语言基础教程(fgets和fputs)

文章目录 前言一、fputs函数二、fgets函数三、fputc和fgetc函数总结 前言 本篇文章我们来讲解一下fgets和fputs函数&#xff0c;这两个函数通常用来作为输入和输出功能使用。 一、fputs函数 fputs函数是C语言标准库中的一个输出函数&#xff0c;用于将字符串写入到指定的文件…

mysql主从同步怎么跳过错误

今天介绍两种mysql主从同步跳过错误的方法&#xff1a; 一、两种方法介绍 1、跳过指定数量的事务&#xff1a; mysql>slave stop; mysql>SET GLOBAL SQL_SLAVE_SKIP_COUNTER 1 #跳过一个事务 mysql>slave start2、修改mysql的配置文件&#xff0c;通过slav…

The Sandbox 重新上线,带来全新体验!

在经历了一个充满史诗般新回忆的全力开局后&#xff0c;我们短暂休息了片刻&#xff0c;为玩家准备了全新的、惊心动魄的游戏活动。 我们已经完成了功能的微调&#xff0c;准备将您的游戏体验提升到一个全新高度&#xff01; 想知道我们正在做什么吗&#xff1f;现在还无法公开…

iTOP-STM32MP157开发板Linux Misc驱动-编译驱动程序

这里我们以 stm32mp157 开发板为例&#xff0c;将杂项设备驱动编译成模块&#xff0c;请参考本手册第三十七章 Linux 内核模块。我们将 misc.c 文件拷贝到 Ubuntu 的/home/nfs/03 目录下。将上次编译 helloworld 的 Makefile 文 件拷贝到 misc.c 同级目录下&#xff0c;修改 …

指针学习(特殊指针)

1.char型指针 char型指针实质上跟别的类型的指针并无本质区别&#xff0c;但是C语言中的字符串以字符数组的方式存储&#xff0c;而数组在大多数场合又会表现为指针&#xff0c;因此字符串在绝大多数场合就表现为char型指针。 例如&#xff1a; char *p "abcd"; …

axios的如何使用

1、axios的使用第一步先装包 npm i axios-S 2、axios的使用方法&#xff0c;先导入包&#xff0c;再绑定事件&#xff0c;再注册事件 3、axios如何实现post请求 4、Vue挂载axios,简便输入地址&#xff1a; 5、通过this实例&#xff0c;可以访问到axios的链接 6、给他改成$http…

【李宏毅 DLHLP 深度学习人类语言处理 HW1】

李宏毅 DLHLP 深度学习人类语言处理 HW1 相关资料HW1 语音小白在网上没有找到这门课的作业分享&#xff0c;那就记录一下自己的作业吧。 相关资料 课程官网&#xff1a;https://speech.ee.ntu.edu.tw/~hylee/dlhlp/2020-spring.php 作业github代码1&#xff1a;https://githu…

用抓包工具结合局域网代理技术爬取meituan某些商家的数据

众所周知&#xff0c;爬虫玩的好&#xff0c;牢饭吃的早&#xff08;如有侵犯利益&#xff0c;请您告知&#xff0c;我将立删&#xff01;&#xff09;。 其实抓包嘛&#xff0c;简单的H5网页直接就能用浏览器的开发者工具进行抓包&#xff0c;但是很多平台剔除了网页版&#…

《面试1v1》Kafka与传统消息系统区别

&#x1f345; 作者简介&#xff1a;王哥&#xff0c;CSDN2022博客总榜Top100&#x1f3c6;、博客专家&#x1f4aa; &#x1f345; 技术交流&#xff1a;定期更新Java硬核干货&#xff0c;不定期送书活动 &#x1f345; 王哥多年工作总结&#xff1a;Java学习路线总结&#xf…

C语言:动态版本通讯录(静态版本的改进)

文章目录 一、改进方向1.结构2.初始化3.增加联系人and检查容量4.退出 二、代码实现总结 通讯录静态版本的实现思路与完整代码 一、改进方向 对于管理数据&#xff0c;我们主要进行增删查改操作&#xff0c;我们要改进静态版本的通讯录&#xff0c;主要在于增加数据方向。而删除…

C++数组、向量和列表的练习

运行代码&#xff1a; //C数组、向量和列表的练习 #include"std_lib_facilities.h"int main() try {int ii[10] { 0,1,2,3,4,5,6,7,8,9 };for (int i 0; i < 10; i)//把数组中的每个元素值加2ii[i] 2;vector<int>vv(10);for (int i 0; i < 10; i)vv…

Transformer模型简单介绍

Transformer是一个深度学习模型。主要功能通俗的来说就是翻译。输入&#xff0c;处理&#xff0c;输出。 https://zhuanlan.zhihu.com/p/338817680 大牛写的很完整 目录 总框架Encoder输入部分注意力机制前馈神经网络 Decoder 总框架 Encoders: 编码器Decoders: 解码器 Encoder…

AT指令介绍

一、基础知识 1、用途&#xff1a;用来控制TE&#xff08;TerminalEquipment&#xff09;和MT(Mobile Terminal)之间交互的规则&#xff0c;如下图所示。在GSM网络中&#xff0c;用户可以通过AT命令进行呼叫、短信、电话本、数据业务、传真等方面的控制。&#xff08;AT指令只…

BUG:pm2启动verdaccio报错:Invalid or unexpected toke

输入命令&#xff1a; pm2 state verdaccio 问题描述&#xff1a; pm2 logs verdaccio报错翻译&#xff1a;数据格式错误 导致我呢提原因&#xff0c;没有找到运行文件&#xff0c; 发现问题&#xff1a;因为命令默认查找verdaccio是去系统盘查找。 解决方式 1&#xff1a;…

探索单例模式:设计模式中的瑰宝

文章目录 常用的设计模式有以下几种&#xff1a;一.创建型模式&#xff08;Creational Patterns&#xff09;&#xff1a;二.结构型模式&#xff08;Structural Patterns&#xff09;&#xff1a;三.行为型模式&#xff08;Behavioral Patterns&#xff09;&#xff1a;四.并发…