MySQL 关键特性一:插入缓冲、双写缓冲

news2024/12/24 20:36:25
前言

​ 本文主要介绍 mysql 的几大特性之几,如:双写缓冲和插入缓存。

双写缓冲
基本概念

​ 双写缓冲(doublewrite buffer)是MySQL/InnoDB中用于支持原子页面更新的一种机制。在传统的数据库系统中,为了保证数据的一致性和可恢复性,通常需要进行冗余写入操作。这种冗余写入通过在原始数据写入后,再将这些数据写入一个额外的缓冲区来实现,从而确保即使在发生故障的情况下也能从备份数据中恢复。

核心就是通过备份数据页的方式保证数据的可靠性、一致性

​ 然而,这种冗余写入操作会对数据库性能产生负面影响,并且增加了存储设备的写入流量,尤其是在使用基于闪存的SSD作为存储介质时。随着非易失性内存(NVM)技术的发展,如PCM和STT-MRAM,它们提供了低延迟、高带宽、非易失性和高容量等特点,为改善数据库事务处理提供了新的可能性。

​ 在最新的研究中,提出了一种名为LSBM的日志结构化缓冲管理器,该管理器利用NVM技术来高效地原子更新页面。LSBM通过异地更新页面来实现原子性,并进行页面缓冲以提高性能。此外,LSBM还能够动态回收缓冲页面,以减少对存储的写入流量。通过在NVDIMM上实现LSBM并将其移植到MySQL/InnoDB中,实验结果表明LSBM不仅提高了数据库性能,还减少了在线事务处理(OLTP)工作负载上的写入流量。

​ 因此,对于使用MySQL/InnoDB的数据库系统来说,考虑采用基于NVM的LSBM可以有效地优化双写缓冲机制,既保持了数据的一致性和可恢复性,又显著提升了数据库的整体性能和存储效率。

结构
  1. 在内存结构中,Doublewrite Buffer由128个页(Page)构成,大小是2MB。这些页在内存中以Doublewrite Buffer的形式存在。

  2. 在磁盘结构中,Doublewrite Buffer在系统表空间上是128个页(2个区,extend1和extend2),大小也是2MB。这些页在磁盘上以Doublewrite File的形式存在。

工作流程
  1. 写操作触发: 当执行INSERT、UPDATE或DELETE等写操作时,MySQL首先将数据写入双写缓冲区。
  2. 同步到Doublewrite File: Doublewrite Buffer 的内存中的数据页会刷写到Doublewrite Buffer的磁盘上,分两次写入磁盘共享表空间中(连续存储,顺序写,性能很高),每次写1MB
  3. 实际数据写入: 一旦Doublewrite File中的数据被确认已经写入磁盘,MySQL就可以将这些数据写入实际的数据文件中
  4. 恢复机制: 如果在写操作过程中发生故障,MySQL可以从Doublewrite File中恢复数据。由于Doublewrite File中的数据是完整的,因此可以用来修复损坏的数据文件,确保数据的完整性和一致性。

在这里插入图片描述

为什么需要双写缓冲

​ 常见的服务器一般都是Linux操作系统,Linux文件系统页(OS Page)的大小默认是4KB。而MySQL的页(Page)大小默认是16KB。MySQL程序是跑在Linux操作系统上的,需要跟操作系统交互,所以MySQL中一页数据刷到磁盘,要写4个文件系统里的页。

​ 需要注意的是,这个操作并非原子操作,比如我操作系统写到第二个页的时候,Linux机器断电了,这时候就会出现问题了。造成”页数据损坏“。并且这种”页数据损坏“靠 redo日志是无法修复的。

重做日志中记录的是对页的物理操作,而不是页面的全量记录,而如果发生partial page write(部分页写入)问题时,出现问题的是未修改过的数据,此时重做日志(Redo Log)无能为力。写doublewrite buffer成功了,这个问题就不用担心了

插入缓冲
基本概念

​ MySQL的insert buffer是InnoDB存储引擎的一个重要特性,主要用于优化非聚集索引的插入和更新操作。以下是关于MySQL insert buffer的详细解释:

​ Insert buffer是一种特殊的数据结构(B+ tree),并不是缓存的一部分,而是物理页。当受影响的索引页不在buffer pool中时,MySQL会使用insert buffer来进行数据插入。

​ 对于非聚集索引的插入或更新操作,MySQL不会每次直接将数据插入到索引页中。相反,它会先将数据存储在一个临时的区域(即insert buffer)中,然后再逐步将这些数据合并到目标索引页中。

​ 从性能改进的角度来看,使用非集群次级索引可能会导致额外和随机的磁盘访问,从而降低存储设备的性能。MySQL的存储引擎通过插入缓冲来缓解这一问题,避免了额外的磁盘访问。这表明插入缓冲在减少磁盘I/O操作中起到了重要作用,有助于提高数据库的整体性能。

适用场景

​ MySQL在我们对非唯一的二级索引进行DML(删除行、写入行、修改行)时的优化

为什么是非唯一索引?

​ 当我们对唯一索引进行插入的时候需要查询数据是否唯一,如果数据在缓冲池中则直接读取缓冲池,如果数据不在缓冲池中则读取磁盘数据页,所以唯一索引会产生大量磁盘IO。

原理

对非唯一二级索引插入的流程如下:

  1. 数据在缓冲池中,直接修改缓冲池数据页
  2. 数据不在缓冲池中
    1. 写入到 insert buffer,异步刷新到磁盘

insert buffer 数据写回磁盘的时机:

  1. 辅助索引页被读取到缓冲池时
    1. 当辅助索引页被读取到缓冲池时,例如正在执行正常的 select 查询操作,这时需要检查 Insert Buffer Bitmap 页,然后确认该辅助索引页是否有记录存放于 Insert Buffer B+ 树中。若有,则将 Insert Buffer B+ 树中该页的记录插入到辅助索引页中
  2. insert buffer bitmap 页追踪到该辅助索引页已经没有可用空间
    1. Insert Buffer Bitmap是InnoDB存储引擎中用于追踪每个辅助索引页的可用空间,并确保至少有1/32页的空间以防止插入操作导致页面溢出。这个特殊的数据页类型可以标记多个辅助索引页的可用空间,以保证每次合并插入操作的成功
  3. Master Thread
    1. 在 Master Thread 中每秒或每10秒会进行一次 Merge Insert Buffer 操作

为什么 insert buffer 能提高性能

​ Insert Buffer B+ 树通过将对数据页的多次操作通过一次操作合并到原有的辅助索引中

insert buffer 提高了哪方面的性能

减少了磁盘随机读,因为当数据不在内存页的时候也不用去磁盘读取对应的数据页再更新数据页,而是直接存储在 Insert Buffer 中,再择机刷会磁盘

insert log 和 redo log 的区别
  1. 功能和目的
    • Insert Buffer:主要用于优化非聚集索引(辅助索引)的插入操作。当受影响的索引页不在Buffer Pool中时,会将其放入Insert Buffer中,以便后续合并操作。
    • Redo Log:用于保证事务的原子性和持久性,记录的是页的物理修改操作,用来恢复提交事务修改的页操作。
  2. 数据结构
    • Insert Buffer:是一种特殊的数据结构(B+ tree),并不是缓存的一部分,而是物理页。
    • Redo Log:由每个512字节大小的日志块组成,存储在内存中的redo log buffer中。
  3. 应用场景
    • Insert Buffer:主要针对非聚集索引的插入或更新操作,当插入的索引页不在Buffer Pool中时使用。
    • Redo Log:主要用于恢复提交后的物理数据页,确保数据的一致性和持久性
Reference
  1. https://cloud.tencent.com/developer/article/2398501
  2. https://www.cnblogs.com/booksea/p/17380938.html
  3. https://juejin.cn/post/6953442154249191454

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1789146.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

小米商城格式化检测点

小米商城格式化检测点: var a function () {var x !0;return function (a, t) {var e x ? function () {if (t) {var x t.apply(a, arguments);t null;return x;}} : function () {};x !1;return e;};}();var t {};function e(n) {var r a(this, function…

数据持久化第七课-URL重写与Ajax

数据持久化第七课-URL重写与Ajax 一.预习笔记 1.URL重写(对网页地址进行保护) 首先编写module,实现对网络地址的处理 其次就是module的配置 最后验证url重写技术 2.Ajax数据交互 编写后端响应数据 处理跨域的配置问题 运行项目得到后端响应数据的地址 编写前端ajax进行数据请…

珈和科技携手浙江省气候中心,打造农业气象数字化服务新标杆!

古谚有云:春耕夏种秋收冬藏,皆在天时。可天有不测风云,农有“旦夕祸福”。寒潮、干旱、洪涝等气象灾害频繁发生,给农业生产带来了巨大挑战。 气候变化直接影响着农业生产,数字化时代,如何依靠科技手段降低…

解决 clickhouse jdbc 偶现 failed to respond 问题

背景 Clickhouse集群版本为 Github Clickhouse 22.3.5.5, clickhouse-jdbc 版本为 0.2.4。 问题表现 随着业务需求的扩展,基于Clickhouse 需要支持更多任务在期望的时效内完成,于是将业务系统和Clickhouse交互的部分都提交给可动态调整核心…

【面试笔记】单片机软件工程师,工业控制方向(储能)

文章目录 1. 基础知识1.1 C语言笔试题1.1.1 用宏定义得到一个数组所含的元素个数1.1.2 定义函数指针从程序固定地址(0)开始执行1.1.3 volatile的含义及作用1.1.4 32位系统,整数7和-7,分别以大端和小端存储,请示意说明 1.2 嵌入式基础1.2.1 简…

知识图谱应用---智慧金融

文章目录 智慧金融典型应用 智慧金融 智慧金融作为一个有机整体,知识图谱提供了金融领域知识提取、融合、分析、推断、决策等功能,如下图所示。在场景方面,智慧金融涵盖智慧支付、智慧财富管理、智慧银行、智慧证券、智慧保险、智慧风控等诸多…

【教程】使用 Tailchat 搭建团队内部聊天平台,Slack 的下一个替代品!

前言 多人协作,私有聊天一直是团队协作的关键点,现在有很多专注于团队协作的应用和平台,比如飞书、企业微信和Slack等。这期教程将带你手把手的搭建一个在线的团队协作向聊天室,希望对你有所帮助! 本期聊天室使用TailChat作为服务…

Rust 第三方库创建和导入(cargo --lib)

前言 日常开发过程中,难免会有一些工具方法,多个项目之间可能会重复使用。 所以将这些方法集成到一个第三方包中方便后期维护和管理, 比如工具函数如果需要修改,多个项目可能每个都需要改代码, 抽离到单独的包中只需要…

esp32-c6所有配套教程

1.介绍 本文是esp32-c6所有资料的介绍 如果需要详细代码的话请访问下面这个链接 esp32-c6使用教程wifi(espidf修改成arduino)附带代码websocket,舵机,点灯【2024年】-CSDN博客 配置环境 视频教程 0-2设置开发环境_哔哩哔哩_bi…

【python】成功解决“ImportError: cannot import name ‘triu’ from ‘scipy.linalg’”错误的全面指南

成功解决“ImportError: cannot import name ‘triu’ from ‘scipy.linalg’”错误的全面指南 在Python编程中,尤其是在使用scipy这个科学计算库时,可能会遇到ImportError错误,提示无法从scipy.linalg模块中导入名为triu的函数。这个错误通…

Linux入门教程笔记(一文带你了解Linux并精通)

文章目录 一、Linux概述二、Linux目录结构(重点)2.1 Linux文件系统的类型2.2 Linux文件系统的结构2.3 具体的目录结构2.3.1 Linux 根目录2.3.2 Linux /usr目录2.3.3 Linux /var 目录2.3.4 tar包存放目录:crossed_swords: 三、vi和vim编辑器四、Lnux开机&…

SpringMVC接收数据

SpringMVC接收数据 SpringMVC处理请求流程 SpringMVC涉及组件理解: DispatcherServlet : SpringMVC提供,我们需要使用web.xml配置使其生效,它是整个流程处理的核心,所有请求都经过它的处理和分发![ CEO ]HandlerMappi…

16个常用的思维模型

01.机会成本 02.沉没成本 03.直觉思维 04.决策树 05.非SR模型 06.确认性偏差 07.易得性偏差 08.逆向思维 09.六顶思考帽 10.101010旁观思维 11.升级思维 11.笛卡尔模型 13.第一性原理 14.奥卡姆剃刀理论 15.马斯洛需求层次理论 16.反脆弱思维 来源:16个常用的思维模…

基于最大重叠离散小波变换的PPG信号降噪(MATLAB 2018)

光电容积脉搏波PPG信号结合相关算法可以用于人体生理参数检测,如血压、血氧饱和度等,但采集过程中极易受到噪声干扰,对于血压、血氧饱和度测量的准确性造成影响。随着当今社会医疗保健技术的发展,可穿戴监测设备对于PPG信号的质量…

WSDM 2023 推荐系统相关论文整理(三)

WSDM 2023的论文录用结果已出,推荐系统相关的论文方向包含序列推荐,点击率估计等领域,涵盖图学习,对比学习,因果推断,知识蒸馏等技术,累计包含近四十篇论文,下文列举了部分论文的标题…

Source Insight 4.0安装和使用

文章目录 一、前言二、新建工程2.1 新建工程2.2 同步工程 3 Source Insight怎么生成函数调用关系图?3.1 打开关系窗口3.2 打开关系函数3.3 修改关系属性3.4设置 Relation Window Options3.5 设置Levels3.6 修改显示模式 4 下载地址 一、前言 Source Insight 4.0 是每…

Blog项目切换Markdown编辑器———LayUI弹出层弹出写在页面的内容导致的各种bug

【2024.5.24回顾】 1 问题描述(描述完自己解决了…) 正常情况 点击添加文章按钮后,弹出文章编辑界面,如果用富文本功能编辑,则一切正常。可以多次打开、关闭 Markdown 如果在弹出层中点击了切换编辑器按钮,会成功切换为markd…

Android RelativeLayout Rtl布局下的bug:paddingStart会同时作用于左右内边距

问题现象 如上图,只是设置了paddingStart,在RTL布局下,左右都产生了10dp的间距。其他布局如LinearLayout,FrameLayout则没有这个问题。 private void positionAtEdge(View child, LayoutParams params, int myWidth) {if (isLayou…

simCSE句子向量表示(1)-使用transformers API

SimCSE SimCSE: Simple Contrastive Learning of Sentence Embeddings. Gao, T., Yao, X., & Chen, D. (2021). SimCSE: Simple Contrastive Learning of Sentence Embeddings. arXiv preprint arXiv:2104.08821. 1、huggingface官网下载模型 官网手动下载:pri…

【Python数据分析--Numpy库】Python数据分析Numpy库学习笔记,Python数据分析教程,Python数据分析学习笔记(小白入门)

一,Numpy教程 给大家推荐一个很不错的笔记,个人长期学习过程中整理的 Python超详细的学习笔记共21W字点我获取 1-1 安装 1-1-1 使用已有的发行版本 对于许多用户,尤其是在 Windows 上,最简单的方法是下载以下的 Python 发行版…