Redis---持久化

news2025/2/22 10:43:07

Redis是内存数据库,是把数据存储在内存中的,但是内存中的数据不是持久的,如果想要做到持久,那么就需要让redis将数据存储到硬盘上。

Redis持久化有两种策略:

  • RDB  ==> Redis DataBase   RDB机制采取的是定期备份
  • AOF ==>  Append Only File  AOF机制采取的是实时备份

接下来将好好说说这两种策略~

RDB

RDB会定期地将Redis中的数据生成一份快照,接着将这份快照保存到硬盘中。后续Redis重启了,就会读取这份快照,将数据恢复回来。

定期具体点,又分为两种方式:1.手动触发  2.自动触发

手动触发

用户通过redis客户端,执行特定的命令,手动地触发快照生成。

  • save:执行save的时候,redis会全力以赴地进行“快照生成”操作,此时会阻塞redis的其它客户端的命令,导致类似keys *的后果,基本不采取。
  • bgsave:Redis进程执行fork操作创建出子进程,RDB持久化过程交由子进程去操作,完成后自动结束。阻塞只发生在fork阶段、一般时间很短。

自动触发

1.在redis的配置文件中,设置save配置。如”save m n“表示m秒内,数据集发生了n次修改,自动RDB持久化。

2.也可以从节点进行全量复制操作时,主节点自动进行RDB持久化,随后将RDB文件内容发送给从结点。

3.还可以执行shutdown命令,关闭redis,执行RDB持久化。

bgsave流程说明

1.执行bgsave命令后,redis父进程首先会判断当前是否存在正在执行的子进程,如果有,则返回。

2.如果没有,则通过fork创建子进程,在创建子进程时会阻塞父进程。创建完成后,bgsave会返回“background saving started”信息,不再阻塞父进程,父进程接着下面的操作。

3.子进程创建出来后,会创建RDB文件,由于子进程继承了父进程的内存、文件描述符等等,因此可以根据父进程中的内存的数据生成快照,并且对原有的RDB文件进行替换,结束后发送信号通知父进程表示完成,接着子进程结束。

RDB文件

redis生成的RDB文件,是在redis的工作目录中的,可以在redis的配置文件中进行设置。生成的RDB文件为:dump.rdb

RDB为使用LZF算法,将数据进行压缩,并且以二进制的形式,保存在这个文件中。虽然压缩会消耗CPU资源,但是能节省不少空间。

在redis服务器启动的时候,如果dump.rdb文件被损坏,那么服务器会启动失败(使用RDB机制的情况下)。因此redis提供了RDB文件的检测工具:redis-check-dump。

dump.rdb文件始终只有一个:尽管进行多次的RDB持久化,RDB会把要快生成的快照数据先保存在一个临时文件中,等快照数据生成完毕,会删除原来的dump.rdb,生成新的dump.rdb。

RDB的优缺点

优点:

①RDB是一个压缩的二进制文件,代表着某个时间点中redis的内存中的数据,非常适用于备份,全量复制等场景。

②redis加载RDB数据比AOF数据快。

缺点:

①RDB没办法进行实时持久化,每次运行bgsave都需要创建子进程,执行成本高。

②RDB有多个版本,兼容性存在问题。

RDB最大的问题在于不能实时持久化,在两次生成快照期间,可能会由于某种因素导致redis服务器重启,从而导致数据丢失的问题。

AOF

AOF介绍

AOF提供的是实时的持久化,解决RDB不能持久化的问题。AOF类似于MySQL中的binlog,会将用户的每一个操作,记录在文件中。当redis服务器重启后,会读取AOF的文件来恢复数据。

在redis的配置文件中,将AOF机制启动:

启动后重启redis服务器,则开启aof,在工作目录(/var/lib/redis)中出现了appendonly.aof的文件,这个文件就是用于记录redis内存数据的文件。

AOF是一个文本文件:

AOF工作流程

AOF的工作流程操作:命令写入(append)、文件同步(sync)、文件重写(rewrite)、重启加载(load)。

所有的写入(append) 会追加到aof_buf缓冲区中,接着AOF会根据策略向硬盘做出同步操作。

如果AOF文件过大,需要进行重写(rewrite),进行压缩,节省空间。

当redis服务器启动时,会加载AOF文件进行数据的恢复。

AOF过程中为什么需要aof_buf这个缓冲区?

换句话说,引入AOF后,redis又要写内存又要写硬盘,这样效率会降低吗?其实不会,因为AOF机制,会先将数据放入aof_buf缓冲区中,数据累积到一定的量后,统一写入硬盘,降低IO次数,并且采取的是顺序写入,效率高。

同时,redis还提供了不同的缓冲区策略,给用户根据实际情况做出合理的选择。

文件同步

可配置值说明
always

命令写入aof_buf后调用fsync同步,完成后返回。频率和数据可靠性最高,性能最低

everysec

命令写入aof_buf后只执行write操作,不进行fsync,每秒由同步线程进行fsync。

频率和数据可靠性一般,性能一般

no

命令写入aof_buf后只执行write操作,由os控制fsync。

频率和数据可靠性低,性能最高

系统调用write和fsync

write操作会在写入系统缓冲区后立即返回。

fsync只针对单个文件操作,强制硬盘同步,阻塞直到数据完全写入硬盘。

重写机制

随着AOF文件越来越大,它会影响到redis下次启动的时间,因为redis服务器在启动的时候,需要读取AOF文件,为了解决这个问题,AOF采取了重写机制。

AOF文件记录了用户的操作过程,但实际上,redis启动时读取AOF文件,只关心最终结果。比如用户A对同一个变量做了增加、修改、修改、修改操作,redis在读取时,只关心最后一次的修改,并不关心前面的操作如何。

因此,redis会对AOF文件进行整理,这个整理就是提出冗余的操作,合并一些操作。注意,这个过程,也是重新生成了一份AOF文件,AOF文件重写是把Redis进程内的数据转化为写命令同步到新的AOF文件。

AOF重写触发

AOF重写触发可以分为手动触发和自动触发。

  • 手动触发:调用bgwriteaof命令
  • 自动触发:根据auto-aof-rewrite-min-size和auto-aof-rewrite-percentage参数确定自动触发时机。

auto-aof-rewrite-min-size:表示触发从写时AOF最小文件大小,默认64MB.

uto-aof-rewrite-percentage:代表当前AOF占用大小相较于上次重写时增加的比例。

AOF重写流程

父进程通过fork创建子进程,子进程由于继承了父进程的内存、文件描述符等,可以把父进程fork前内存中的数据获取出来,以AOF的格式写入到一个新的AOF文件中。(内存中的数据,相当于整理后的数据了)。

在子进程写新aof文件的同时,父进程仍然不停地接收新的数据,并将这些数据同时写到aof_buf缓冲区和aof_rewrite_buf缓冲区中。aof_buf缓冲区的数据会被刷新到旧AOF文件中,而aof_rewrite_buf是用于子进程将新aof文件写完后,通知父进程,父进程再把这个缓冲区中的数据写入到新AOF文件中,最后用新AOF文件替换旧AOF文件。

父进程在重写的过程中,还在对旧AOF文件进行写入的目的:

在极端情况下,在子进程重写时服务器突然挂了,重启后,子进程内存的数据会丢失,新AOF文件的内容不完整,可以使用旧AOF文件来保证数据的完整性。

如果在执行bgwriteaof时,此时redis正在进行重写,那么就不执行了。

如果在执行bgwriteaof时,此时的redis正在生成RDB文件的快照时,会等待RDB文件生成完毕,再进行重写。

混合持久化

AOF是按照文本方式进行写入的,后续加载成本较高,因此redis结合RDB和AOF两种方式的特定:

按照AOF的方式将每一个操作记录在文件中,触发AOF重写,就会将当前内存的状态按照RDB的二进制格式写入到新的AOF文件中,后续再进行操作时,依然会按照AOF的文本格式进行追加写入。简单的说就是在重写时采取RDB的二进制格式写入,在其它操作依然采用AOF的文本格式进行写入。

混合持久化在配置文件中需要打开:

Redis的选择

当AOF和RDB同时打开时,redis会优先选择AOF方式,因为AOF中包含的数据会比RDB的安全,完整。

总结

Redis提供了两种持久化方式,就是RDB和AOF。

RDB是对内存数据的快照,采取的是定期持久化,AOF是对修改命令的保存,采取的是实时持久化,并且由有重写机制来定期压缩AOF文件。

RDB和AOF都使用fork创建子进程,利⽤Linux子进程拥有父进程内存快照的特点进行持久化,尽可能不影响主进程继续处理后续命令。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1478198.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Kaggle 竞赛入门

打比赛不用写算法源码,应用的时候不用自己写。学习的时候可以自己写。 Kaggle 竞赛入门 认识 Kaggle 平台Kaggle竞赛知识前提结构化数据前提图像数据文本数据 Kaggle竞赛套路一个赛题的完整流程 认识 Kaggle 平台 Kaggle 官网 主页,比赛(数据…

Linux系统Docker部署Nexus Maven并实现远程访问本地管理界面

文章目录 1. Docker安装Nexus2. 本地访问Nexus3. Linux安装Cpolar4. 配置Nexus界面公网地址5. 远程访问 Nexus界面6. 固定Nexus公网地址7. 固定地址访问Nexus Nexus是一个仓库管理工具,用于管理和组织软件构建过程中的依赖项和构件。它与Maven密切相关,可…

计算机网络原理--传输层

🎥 个人主页:Dikz12📕格言:那些在暗处执拗生长的花,终有一日会馥郁传香欢迎大家👍点赞✍评论⭐收藏 目录 TCP/IP五层(或四层)模型 传输层 TCP和UDP的区别 UDP协议 校验和 如何…

配置前端项目到 github-pages

Quickstart for GitHub Pages - GitHub Docs

腾讯云优惠:2024云服务器租用价格表,买前必看

一张表看懂腾讯云服务器租用优惠价格表,一目了然,腾讯云服务器分为轻量应用服务器和云服务器CVM,CPU内存配置从2核2G、2核4G、4核8G、8核16G、4核16G、8核32G、16核32G、16核64等配置可选,公网带宽1M、3M、5M、12M、18M、22M、28M…

LINUX基础培训二十五之shell表达式与运算

一、条件表达式 条件表达式是用于判断条件是否满足的逻辑表达式,当条件为真,返回0,否则返回1。 常用语法: 1、test 测试表达式 2、[ 测试表达式 ] #两边需要有空格 3、[[ 测试表达式 ]] 4、(( 测试表达式 )) 第一种和第二种是等…

鸿蒙这么大声势,为何迟迟看不见岗位?最新数据来了

对于鸿蒙生态建设而言,2024年可谓至关重要,而生态建设的前提,就是要有足够的开发人才。与之对应的,今年春招市场上与鸿蒙相关岗位和人才旺盛的热度,一方面反应了鸿蒙生态的逐渐壮大,另一方面也让人们对鸿蒙…

Tomcat源码解析(二): Bootstrap和Catalina

Tomcat源码系列文章 Tomcat源码解析(一): Tomcat整体架构 Tomcat源码解析(二): Bootstrap和Catalina 目录 一、基础组件1、Lifecycle生命周期顶级接口2、组件的默认实现 二、启动类Bootstrap1、main2、init3、load与start 三、加载Catalina1、load2、s…

2024腾讯云优惠券免费领取_代金券查询和使用方法

腾讯云代金券领取渠道有哪些?腾讯云官网可以领取、官方媒体账号可以领取代金券、完成任务可以领取代金券,大家也可以在腾讯云百科蹲守代金券,因为腾讯云代金券领取渠道比较分散,腾讯云百科txybk.com专注汇总优惠代金券领取页面&am…

工厂模式 详解 设计模式

工厂模式 其主要目的是封装对象的创建过程,使客户端代码和具体的对象实现解耦。这样子就不用每次都new对象,更换对象的话,所有new对象的地方也要修改,违背了开闭原则(对扩展开放,对修改关闭)。…

spring6学习笔记

1.环境准备 1.idea建立一个空项目,jdk要求是17 2.Maven配置(和mybatis里一样) 3.新建一个模块 2.ocp原则 3.依赖倒置原则(DIP) 什么是依赖倒置原则? 1.面向接口编程,面向抽象编程,不要面向…

Windows安装VNC连接工具并结合cpolar实现远程内网Ubuntu系统桌面

文章目录 前言1. ubuntu安装VNC2. 设置vnc开机启动3. windows 安装VNC viewer连接工具4. 内网穿透4.1 安装cpolar【支持使用一键脚本命令安装】4.2 创建隧道映射4.3 测试公网远程访问 5. 配置固定TCP地址5.1 保留一个固定的公网TCP端口地址5.2 配置固定公网TCP端口地址5.3 测试…

回溯【基础算法精讲 14】

视频地址 : 回溯算法套路①子集型回溯【基础算法精讲 14】_哔哩哔哩_bilibili 基本概念 1 . 例子 例如从abc和def(n 2)中各选出一个组成新的字符串? 如果n很大 , 这个时候for循环的表达能力有限 ; 2 . 原问题 和 子问题 3 . 增量构造答案 这个增量构造答案的过程就是回溯…

java之Bean对象

1. 什么是Bean? Bean被实例化的,是被Spring框架所管理的Java对象。 Spring容器会自动完成Bean的实例化。将所创建的的Bean自动注入到Ioc容器中以供调用。 spring框架中 IOC容器中管理的对象就是Bean对象 2. 第三方bean Bean 因为第三方bean&#xff0…

SQL函数学习记录

聚合函数 函数是编程语言的基础之一,在对数字的运算中,我们用的最多的就是聚合函数,本篇接下来就详细阐述下SQL中聚合函数的运用。 什么是聚合函数(aggregate function)? 聚合函数指的是对一组值执行计算…

手撕LRU缓存——LinkedHashMap简易源码

题目链接:https://leetcode.cn/problems/lru-cache/description/?envTypestudy-plan-v2&envIdtop-100-liked 原理非常简单,一个双端链表配上一个hash表。 首先我们要知道什么是LRU就是最小使用淘汰。怎么淘汰,链表尾部就是最不常用的直接…

92、评估代码生成操作带来的性能提升

本节评估一下,通过代码生成操作之后,对于模型的性能提升。 评估下性能 在相同的环境下,分别运行 4th_no_malloc 和 5th_codegen 下的 compile.sh 脚本进行代码编译,然后运行编译后生成的可执行文件 ./resnet。 可以分别获取到权值预加载前后的性能指标。 注意:不同电脑机…

可视化图文报表

Apache Echarts介绍 Apache Echarts是一款基于Javascript的数据可视化图表库&#xff0c;提供直观&#xff0c;生动&#xff0c;可交互&#xff0c;可个性化定制的数据可视化图表。 官网&#xff1a;Apache ECharts 入门案例&#xff1a; <!DOCTYPE html> <html>…

Git教程-Git的基本使用

Git是一个强大的分布式版本控制系统&#xff0c;它不仅用于跟踪代码的变化&#xff0c;还能够协调多个开发者之间的工作。在软件开发过程中&#xff0c;Git被广泛应用于协作开发、版本管理和代码追踪等方面。以下是一个详细的Git教程&#xff0c;我们将深入探讨Git的基本概念和…

基于大模型思维链(Chain-of-Thought)技术的定制化思维链提示和定向刺激提示的心理咨询场景定向ai智能应用

本篇为个人笔记 记录基于大模型思维链&#xff08;Chain-of-Thought&#xff09;技术的定制化思维链提示和定向刺激提示的心理咨询场景定向ai智能应用 人工智能为个人兴趣领域 业余研究 如有错漏欢迎指出&#xff01;&#xff01;&#xff01; 目录 本篇为个人笔记 记录基…