MySQL日志(undo log 和 redo log 实现事务的原子性/持久性/一致性)

news2024/12/23 9:18:34

日志的重要性

  • 日志绝对是数据库的核心.   持久化的日志记录了各种重要的信息.
  • 数据的恢复需要依赖日志。  慢查询sql语句需要用到慢查询日志。以及错误日志中保存着mysqld数据库服务端在启动过程中发生的重大错误信息...

数据库重要组成

本质上来说是一个文件系统 (两大重要组成部分如下)

  1. 数据库,数据表对应文件 (.frm 表结构文件) (.ibd 索引数据文件) 
  2. 日志文件. logfile

日志的分类

  • 错误日志

错误日志是 MySQL 中最重要的日志之一,它记录了当 mysqld 启动和停止时,以及服务器在运行过程 中发生任何严重错误时的相关信息.当数据库出现任何故障导致无法正常使用时,可以首先查看此日志。

  • 查询日志

普通查询日志和慢查询日志.  最主要的还是慢查询日志

设置慢查询时间, 开启慢查询日志, 然后可以通过慢查询日志来分析执行计划来知晓耗时的sql查询操作, 进而进行添加索引优化.   

那么此时我们可以把表分成n个小表,比如订单表按年份分成多个小表等。

慢查询日志的临界时间, 单位s秒

  • 二进制日志

二进制日志(BINLOG)记录了所有的 DDL(数据定义语言)语句和 DML(数据操纵语言) 语句,但是不包括 数据查询语句。语句以“事件”的形式保存,它描述了数据的更改过程。 此日志对于灾难时的数据恢复起 着极其重要的作用。

对于二进制日志, 我们做不到直接的查看, 直接查看看到的也只是一堆乱码, 所以对于二进制日志想要明文的查看, 我们需要借助一定的工具.                 ---  mysqlbinlog工具

  • 很明显我并没有开启二进制日志, 所以我需要在my.cnf配置文件中配置一下, 开启二进制日志相关配置, 同时重启mysqld

不晓得大家开启二进制日志的过程如何,我开启的过程可谓是颇为曲折.

  1. 权限问题. 要确认你有足够的权限访问my.cnf配置文件  chmod  644 /etc/my.cnf
  2. 我没有修改权限之前出现了如此的错误, 导致我配置文件加上的log-bin没有发挥作用
mysql: [Warning] World-writable config file '/etc/my.cnf' is ignored.

说白了就是/etc/my.cnf文件所写的配置被忽略了

没有上述这个警告之后, 我再次进入my.cnf配置文件添加上如下三行配置就OK了

sudo vim my.cnf

log-bin=mysql-bin  #设置二进制日志路径(系统默认设置)
server-id=1        #选取服务器
expire_logs_days=7 #每过七天清理一次日志

写完之后  systemctl restart mysqld.service;  #重启mysqld服务

再次show variables like '%log_bin%';  完美, 它终于开启了.

查看二进制日志: show binary logs; || show master logs;

分析二进制文件的工具, 我们直接看二进制日志看到的就是一堆乱码, 所以我们需要借助通过mysqlbinlog工具(mysql原生自带的工具)可以快速解析大量的binlog日志文件 

语法格式如下:

 mysqlbinlog --no-defaults --database=db_name --base64-output=decode-rows
-v --start-datetime='start time' --stop-datetime='end time'
mysql-bin.000001 | more

--database=数据库名称, 指定数据库.

base64-output: 指定解码方式, 为base64译码形式

start-datetime and stop-datetime: 指定查看二进制日志的时间段, 不指定默认查看全部时间段更改.

mysql-bin.000001 指定解析查看的二进制日志

可以看到如上这样一条插入语句

  • @1 @2 @3指的是三个字段
  • server id: 表示我们在my.cnf中配置的id, 标识
  • at 400 指的是事务在binlog中记录的位置

二进制日志的两个重要的应用场景:主从复制、数据恢复

对于日志的开启, 我们需要在my.cnf数据库配置文件中书写日志文件相应的配置. 然后进行mysqld的restart重启操作即可
systemctl restart mysqld.service;

  • undo log 和 redo log 

redo log 和 undo log日志

数据落盘

  • 定义: 将内存缓冲区中的数据刷新到磁盘上的操作叫做数据落盘, 数据落盘才是真正的持久化. 才是持久化的核心关键
  • 磁盘上的数据才是掉电之后还在的. 内存上的数据都是临时的.
  • 缓冲区的概念:缓冲区完全就是减少和磁盘交互的次数. 提高效率. 平衡CPU和磁盘硬件交互的速度差异性。

redo log:重做日志, 用于记录事务操作的变化, 确保事务的持久性.  redo log事务开始就开始记录。不论是否提交都会记录下来, 在提交的时候将一次完整的事务刷新到磁盘上. 当数据库出现异常的时候 (掉电等等) 就会根据redo log物理日志恢复到掉电前的时刻, 保证数据的完整性. 

redo log buffer 持久化到磁盘上的时机:commit时刻 或者 定时数据落盘

数据落盘是异步落盘的》  并非是同步实时刷新落盘的, 而是一种另外开启新的线程专门用于异步数据落盘的.    -----》   另外开启的线程作用: 要么通过轮询,或者定时检测什么事件进行处理. 此处就是关注数据落盘,  

下图是借鉴的别人的. 

undo log: 回滚日志

undo log 版本链条: 功能: 1.事务回滚操作      2. MVCC的RC和RR隔离级别下面的readview快照读 (RC: 每一条select语句都产生新的快照数据readview. readview快照数据可根据最新版本更新。   RR: 一个事务创建一个readview, 并且是按照第一次select*的数据产生的. 故而重复度不变, 每次都是最开始的readview快照.)

事务回滚场景:   

1. 事务执行过程中出现了error错误,进行回滚操作

2. 掉电后的数据恢复, 先redo log恢复, 再undo log 回滚

数据更新操作到持久化的过程.

怎么说:  脏数据在写入脏数据缓冲区之前首先需要先完成redo log undo log日志相关的缓存操作.

然后redo log在合适(commit 或者1s)的时机完成数据落盘.   

  • 明确第一点: 持久化核心是redo log,重做日志的事情.   undo log的持久化也只是基于redo log实现的. 将undo log的跟新信息写入到redo log中. 

所以:  持久化保存最重要的是redo log日志, undo log的持久化也是基于redo log的.             

自然写日志肯定就是先写redo log日志缓存, 然后就是写的sql究竟是什么, 与什么是强相关的?

肯定是先写old 老数据恢复相关的, 再写新数据恢复相关的. 所以写redo log缓存的时候先写undo log相关的. 再写sql操作新数据恢复相关的 redo log   

日志记录是从什么时候开始的?

事务开启即开始记录相应的日志记录到内存缓冲区. 

undo log 进行数据落盘了吗?  undo log数据落盘的时机是什么?

MySQL中的Undo Log严格的讲不是Log,而是数据,因此他的管理和落盘都跟数据是一样的

上述回答我是借鉴的知乎上的一则回答. 所以既然跟数据落盘管理机制一样,自然落盘也就是

undo log和脏页按照checkpoint进行落盘。

说白了undo log先于数据落盘的办法采取的是记录相应的redo log用于undo log先于数据的落盘保证.  也是对于undo log和数据掉电未持久化到磁盘上恢复的保证.

Mysql的undo log的落盘机制是什么样的? - 知乎

掉电了, 宕机了,如何实现掉电前的脏数据页的恢复?

  1. 重启
  2. 使用redo log恢复数据(恢复脏页数据)
  3. 使用undo log进行事务回滚 (回滚还未commit但是通过redo log操作恢复的数据)

事务执行COMMIT操作时,会将本事务相关的所有redo log都进行落盘,只 有所有redo log落盘成功,才算COMMIT成功. 否则需要进行rollback操作. 也就是使用undo log事务回滚。

小总结: 

  1. 事务进行过程中,每次DML sql语句执行,都会记录undo log和redo log,然后更新数据形成脏数据页
  2. 先写日志缓存, 再写数据缓存
  3. 先写undo log旧数据恢复相关的redo log, 再写新数据恢复相关的redo log
  4. 先写好内存上的缓冲区缓存.   真正的数据落盘, 都是另外开启线程在一定的时机将数据落盘到磁盘上.    脏数据的落盘并不那么紧要, 只要redo log日志实现了落盘. 就完成了真正的持久化, 哪怕脏数据页还没有数据落盘掉点了. 下一次启动还可以根据redo log恢复数据, 以及undo log回滚回到掉电之前的结果      

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/51401.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

PHP+MySQL基于thinkphp的企业信息销售展示系统的设计

公司企业网站,是一个供为企业推广的平台,是完全的,高速的,开放的,其核心思想是提供一个以自然语言为主的用户界面,让用户能够更好的刚加方便快捷的管理物流信息的一个渠道和平台。本课题的开发工具可以使用PHP开发语言和MySQL数据进行的开发。 该系统的基本功能包括用户注册登录…

JAVA 设计模式篇

JAVA 设计模式篇1、UML类图2、设计原则2.1、开闭原则2.2、里氏代换原则2.3、依赖倒转原则2.4、接口隔离原则2.5、迪米特法则2.6、合成复用原则3、设计模式3.1、单例模式3.1.1、单例模式实现——饿汉式3.1.1.1、静态变量实现3.1.1.2、静态方法实现3.1.1.3、枚举方式3.1.2、单例模…

GRPC远程调用

FAQ | gRPC1. gRPC原理 FAQ | gRPC Asynchronous-API tutorial | C | gRPC 1.1 什么是RPC RPC 即远程过程调用协议(Remote Procedure Call Protocol),可以让我们像调用本地对象一样发起远程调用。RPC 凭借其强大的治理功能,成…

Linux 中的文件简单说明

Linux 中的文件简单说明 作者:Grey 原文地址: 博客园:Linux 中的文件简单说明 CSDN:Linux 中的文件简单说明 说明 本文基于 CentOS 7 根目录(/)下文件夹主要作用 [rootlinux /]# ll / total 16 lrwxrwxrwx. 1 root root…

VMOS虚拟机开源,游戏安全面临新挑战

相信大家对虚拟机并不陌生,一台设备可以模拟出多个操作系统,完美解决了不同场景下设备限制问题,还节约了购买软硬件设备的成本,为工作和生活提供了不少便利,得到了广泛的应用。 而虚拟机技术却被游戏黑灰产所利用&…

全球约有 150 亿台设备在运行 Java,收费后还能用吗?

据估算,全球约有 150 亿台设备在运行 Java™。约900万 Java 程序员.... https://www.oracle.com/java/technologies/downloads/archive 一、Java8及之前的版本均免费 我们可以看到上图中绿色的部分均是免费版本大家可以随便下载随便使用。 二、最后的免费版本 jd…

将光耦合进入单模光纤的最佳工作距离

摘要 光纤是现代光学系统中最通用的部件之一。它们最重要的特点之一是它们能够在远距离(甚至几公里)内以极低的损耗传输光能。另一方面,以一种能够达到尽可能高的效率的方式将光耦合到光纤中通常是一项非常精细的需求:例如&…

美苏太空竞赛历年卫星火箭发射以及历史事件介绍

1957 时间苏联美国折叠时间7月16日在与政府官员的会晤中,科罗廖夫和格鲁什科提出了开发超重型火箭的想法。美国海军对先锋号火箭进行试射。5月1日10月4日卫星号火箭发射了斯普特尼克1号,即第一颗人造卫星。美国海军对先锋号火箭进行试射。10月23日11月3…

ArcGIS API4.X + API文档 本地部署(Tomcat)

前言: js.arcgis.com有时候不太稳定,导致项目或者自己测试代码需要等待远程资源请求,体验感及其不好,能自己掌控的资源最好就别去拿在线的,当然服务器稳定就另当别论。(所以本地部署有两种含义:…

ModStartCMS v5.3.0 任务调度记录,模块市场优化

系统介绍 ModStart 是一个基于 Laravel 模块化极速开发框架。模块市场拥有丰富的功能应用,支持后台一键快速安装,让开发者能快的实现业务功能开发。 系统完全开源,基于 Apache 2.0 开源协议,免费且不限制商业使用。 功能特性 丰…

在vue项目中下载swiper出现:Do not use ‘new’ for side effects报错问题

我报错的情况是:我在单文件组件vue文件中使用new Swiper,报了两个错误,图示: 第一个错误是:‘Swiper’ is not defined 第二个错误是:Do not use ‘new’ for side effects 解决办法: &#x…

【软件测试】7年资深带你详探什么是测试开发?

目录:导读前言一、Python编程入门到精通二、接口自动化项目实战三、Web自动化项目实战四、App自动化项目实战五、一线大厂简历六、测试开发DevOps体系七、常用自动化测试工具八、JMeter性能测试九、总结(尾部小惊喜)前言 在一些大公司里&…

数据结构初阶--二叉树介绍(基本性质+堆实现顺序结构)

树的基本概念和结构 树的相关概念 节点的度:一个节点含有的子树的个数称为该节点的度; 如上图:A的为2叶节点或终端节点:度为0的节点称为叶节点; 如上图:D、F、G、H为叶节点非终端节点或分支节点&#xff1…

Unity笔记(13):Android Movement of Characters[2D]

目录 1、搭建一个测试场景 2、建立画布设置移动按钮 3、编写脚本绑定按钮 AxisTouchButton :ButtonHandler : 4、编写脚本绑定角色 原来的按键移动 修改为触摸按钮 5、导出为APK文件,手机下载进行测试 1、搭建一个测试场景 2、建立画…

【正点原子FPGA连载】第二十四章 双路高速DA实验 摘自【正点原子】DFZU2EG/4EV MPSoC 之FPGA开发指南V1.0

1)实验平台:正点原子MPSoC开发板 2)平台购买地址:https://detail.tmall.com/item.htm?id692450874670 3)全套实验源码手册视频下载地址: http://www.openedv.com/thread-340252-1-1.html 第二十四章 双路…

【EXCEL拦路虎】解决一些常遇到的excel问题

【问题一】 解决.CSV文件转为excel文件乱码问题 方法二:参考 解决Excel打开CSV文件中文乱码问题 【问题二】 解决内容过长后面的空白表格被前一列的字符填满,(内容过长就会覆盖前后的单元格),如下图: 解决…

vue 新增枚举类型栏位

dict-tag 标签新增枚举类型栏位 新增栏位数据字典 新增字典命名规范为coin_表字段名 新增字典枚举数据,key value Value标签格式为 值-key 如 1-成交 分别对应的新增为两张表: Sys_dict_type --字典类型 Sys_dict_data --字典数据 前端栏位 &l…

数据库学习

数据是描述事务的符号记录,包括数字、文字、图像、音频等,以“记录”的形式按统一的格式进行存储;表将不同的记录组织在一起,用来存储具体的数据;数据库是表的集合,是存储数据的仓库,它以一定的…

基于粒子群算法的电力系统无功优化研究(IEEE14节点)(Matlab代码实现)

💥💥💥💞💞💞欢迎来到本博客❤️❤️❤️💥💥💥 📋📋📋本文目录如下:⛳️⛳️⛳️ ​ 目录 1 概述 2 无功优化数学模型 3 …

剑指 Offer 15. 二进制中1的个数

一、题目描述 编写一个函数,输入是一个无符号整数(以二进制串的形式),返回其二进制表达式中数字位数为 ‘1’ 的个数(也被称为 汉明重量).)。 二、示例 示例 1: 输入:n 11 (控制…