Redis 和 Mysql 如何保证两者数据一致性

news2024/10/6 16:17:28

文章目录

    • 概述
    • 解决方案
    • 消息队列+异步重试 基于 RocketMQ 的可靠性消息通信,来实现最终一致
    • Canal 组件,监控 Mysql 中 binlog 的日志,把更新后的数据同步到 Redis 里面
    • 延时双删
    • 弱一致性和强一致性
    • Canal详解

概述

在分布式系统中,保证Redis和MySQL之间的数据一致性是一个复杂且重要的问题。由于Redis是内存数据库,而MySQL是磁盘数据库,它们的特性和持久化方式不同,因此需要特殊的注意和处理来确保数据的一致性。
以下是一些常见的方法来保证Redis和MySQL之间的数据一致性:

  1. 双写模式:在进行写操作时,先将数据写入MySQL,然后再将数据写入Redis。这种方式可以保证MySQL中的数据一定会被同步到Redis中,但是对于读操作来说效率较低。
  2. 异步更新:在进行写操作时,只将数据写入MySQL,然后异步地将数据写入Redis。这种方式可以提高写入操作的效率,但是可能会导致Redis中的数据与MySQL中的数据存在一定的延迟。
  3. 通过消息队列实现数据同步:可以使用消息队列(如Kafka、RabbitMQ等)来实现MySQL和Redis之间的数据同步。当MySQL中的数据发生变化时,将变化的数据写入消息队列,然后Redis订阅消息队列,根据消息内容更新自己的数据。这种方式可以实现异步更新,并且解耦了MySQL和Redis之间的直接依赖。
  4. 定期全量同步:定期从MySQL中读取全量数据,然后覆盖Redis中的数据。这种方式可以保证Redis中的数据与MySQL中的数据完全一致,但是对于大数据量的情况下可能会影响性能。
  5. 使用分布式事务:在一些场景下,可以使用分布式事务来保证Redis和MySQL之间的数据一致性。例如,可以使用基于XA协议的分布式事务管理器(如Seata)来协调Redis和MySQL之间的数据更新操作。
    需要根据具体的业务场景和需求选择合适的数据一致性方案,并进行相应的设计和实现。同时,还需要考虑各种异常情况下的处理,如网络故障、节点宕机等,以确保系统在异常情况下依然能够保持数据一致性。

解决方案

1.基于 MQ 异步同步更新,消息队列+异步重试-比如基于 RocketMQ 的可靠性消息通信,来实现最终一致
2.还可以直接通过 Canal (阿里的一款开源框架)组件,监控 Mysql 中 binlog 的日志,把更新后的数据同步到 Redis 里面。
3.延时双删
缓存延时双删
删除缓存重试机制
读取biglog异步删除缓存
一般情况下,Redis 用来实现应用和数据库之间读操作的缓存层,主要目的是减少数据库 IO,还可以提升数据的 IO 性能。这是它的整体架构
当应用程序需要去读取某个数据的时候,首先会先尝试去 Redis 里面加载,如果命中就直接返回。如果没有命中,就从数据库查询,查询到数据后再把这个数据缓存到 Redis 里面。
在这样一个架构中,会出现一个问题,就是一份数据,同时保存在数据库和 Redis里面,当数据发生变化的时候,需要同时更新 Redis 和 Mysql,由于更新是有先后顺序的,并且它不像 Mysql 中的多表事务操作,可以满足 ACID 特性。所以就会出现数据一致性问题。
在这种情况下,能够选择的方法只有几种
先更新数据库,再更新缓存
先删除缓存,再更新数据库
如果先更新数据库,再更新缓存,如果缓存更新失败,就会导致数据库和 Redis中的数据不一致。
如果是先删除缓存,更新数据库,理想情况是应用下次访问 Redis 的时候,发现 Redis 里面的数据是空的,就从数据库加载保存到 Redis 里面,那么数据是一致的。但是在极端情况下,由于删除 Redis 和更新数据库这两个操作并不是原子的,所以这个过程如果有其他线程来访问,还是会存在数据不一致问题
如果需要在极端情况下仍然保证 Redis 和 Mysql 的数据一致性,就只能采用最终一致性方案。

消息队列+异步重试 基于 RocketMQ 的可靠性消息通信,来实现最终一致

因为延时双删可能会存在第二步的删除缓存失败,导致的数据不一致问题。可以使用这个方案优化:删除失败就多删除几次呀,保证删除缓存成功就可以了呀~ 所以可以引入删除缓存重试机制
在这里插入图片描述

删除缓存重试流程

  1. 写请求更新数据库
  2. 缓存因为某些原因,删除失败
  3. 把删除失败的key放到消息队列
  4. 消费消息队列的消息,获取要删除的key
  5. 重试删除缓存操作

Canal 组件,监控 Mysql 中 binlog 的日志,把更新后的数据同步到 Redis 里面

因为这里是基于最终一致性来实现的,如果业务场景不能接受数据的短期不一致性,那就不能使用这个方案来做
异步更新缓存(基于订阅binlog的同步机制)
MySQL binlog增量订阅消费+消息队列+增量数据更新到redis读Redis
热数据基本都在Redis写MySQL:增删改都是操作MySQL更新Redis数据:MySQ的数据操作binlog,来更新到Redis:
1)数据操作主要分为两大块:一个是全量(将全部数据一次写入到redis)一个是增量(实时更新)。
这里说的是增量,指的是mysql的update、insert、delate变更数据。
2)读取binlog后分析 ,利用消息队列,推送更新各台的redis缓存数据。
这样一旦MySQL中产生了新的写入、更新、删除等操作,就可以把binlog相关的消息推送至Redis,Redis再根据binlog中的记录,对Redis进行更新。
其实这种机制,很类似MySQL的主从备份机制,因为MySQL的主备也是通过binlog来实现的数据一致性。
这里可以结合使用canal(阿里的一款开源框架),通过该框架可以对MySQL的binlog进行订阅,而canal正是模仿了mysql的slave数据库的备份请求,使得Redis的数据更新达到了相同的效果。
当然,这里的消息推送工具你也可以采用别的第三方:kafka、rabbitMQ等来实现推送更新Redis

重试删除缓存机制还可以吧,就是会造成好多业务代码入侵。其实,还可以这样优化:通过数据库的binlog来异步淘汰key。
在这里插入图片描述

以mysql为例吧
● 可以使用阿里的canal将binlog日志采集发送到MQ队列里面
● 然后通过ACK机制确认处理这条更新消息,删除缓存,保证数据缓存一致性

延时双删

redis.delKey(X)
db.update(X)
Thread.sleep(N)
redis.delKey(X)

先删除缓存,再更新数据库,当更新数据后休眠一段时间再删除一次缓存。
这个休眠时间 = 读业务逻辑数据的耗时 + 几百毫秒。为了确保读请求结束,写请求可以删除读请求可能带来的缓存脏数据。
这种方案还算可以,只有休眠那一会(比如就那1秒),可能有脏数据,一般业务也会接受的。但是如果第二次删除缓存失败呢?缓存和数据库的数据还是可能不一致,对吧?给Key设置一个自然的expire过期时间,让它自动过期怎样?那业务要接受过期时间内,数据的不一致咯?还是有其他更佳方案呢?

弱一致性和强一致性

数据同步过程中,会存在短暂的延迟,这属于正常的现象。
在分布式架构中很难实现数据强一致性
弱一致性: 主从之间数据允许不一致性;
强一致性: 主从之间数据必须一致性; 如果实现 成本是非常高,会设计到 一些锁的技术,
最终一致性:短暂的数据延迟是允许的,但是最终数据是需要一致; —在分布式中做数据同步需要经过网络传输的,网络传输数据需要一定的时间, 所以数据短暂的延迟是允许的,但是最终数据一定达成一致。
延迟是很难避免的,优化 减少延迟的时间。 公司中数据 同步延迟 优化在 10-30 毫秒。

Canal详解

Canal 是阿里巴巴开源的数据库变更捕获(CDC)解决方案,主要用于监控数据库的变更,并将这些变更推送到其他数据存储、消息队列等目标端。以下是对 Canal 的详细解释:

  1. 工作原理:
    ○ Canal通过连接数据库的binlog日志,实时解析binlog日志中的数据变更(如insert、update、delete等操作),将这些变更解析成数据库行记录的格式,并推送到外部系统。
    ○ Canal分为客户端和服务端两部分。客户端(Agent)位于数据库服务器上,负责与数据库的binlog日志进行交互,并将解析后的数据变更推送给服务端。服务端(Server)接收客户端推送的数据变更,并将其发送到目标存储或消息队列。
  2. 特点:
    ○ 实时性:Canal能够实时捕获数据库的变更,几乎可以做到毫秒级的实时性。
    ○ 可靠性:Canal保证数据变更的完整性和准确性,可以应对数据库主从切换、网络闪断等异常情况。
    ○ 高性能:Canal使用了一系列性能优化措施,如异步化处理、多线程并发等,保证了高性能的数据变更捕获和传输。
  3. 应用场景:
    ○ 数据同步:将数据库的变更同步到其他数据存储(如另一个数据库、Hadoop、Elasticsearch等)。
    ○ 实时监控:实时监控数据库的变更情况,用于数据审计、报警等用途。
    ○ 缓存更新:将数据库的变更用于更新缓存,提高系统性能和响应速度。
    ○ 搜索引擎索引更新:将数据库的变更同步到搜索引擎(如Elasticsearch)中,用于实时更新索引。
  4. 支持的数据库:
    ○ Canal目前主要支持MySQL数据库,包括MySQL的各种版本,如MySQL5.x、MySQL8.x等。
  5. 架构图:
    ○ Canal的架构包括客户端(Agent)和服务端(Server)两部分,客户端负责与数据库的binlog交互,服务端负责接收客户端推送的数据变更并处理。
    ○ 具体的架构图可以参考官方文档或源码。
    总的来说,Canal是一个功能强大的数据库变更捕获解决方案,可以实现实时的数据库变更监控和同步,广泛应用于数据同步、实时监控等场景。

方案二:还可以直接通过 Canal 组件,监控 Mysql 中 binlog 的日志,把更新后的数据同步到 Redis 里面。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1717104.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

YoloV8改进策略:卷积篇|基于PConv的二次创新|附结构图|性能和精度得到大幅度提高(独家原创)

摘要 在PConv的基础上做了二次创新,创新后的模型不仅在精度和速度上有了质的提升,还可以支持Stride为2的降采样。 改进方法简单高效,需要发论文的同学不要错过! 论文指导 PConv在论文中的描述 论文: 下面我们展示了可以通过利用特征图的冗余来进一步优化成本。如图3所…

动手学深度学习27 GoogLeNet

动手学深度学习27 含有并行连结的网络GoogLeNet/Inception V3 1. GoogLeNet2. 代码3. QA 1. GoogLeNet 白色块用来处理通道数,蓝色块用来抽取信息 stage 高宽减半做完表示一个stage完成 大量使用1*1卷积 降低通道数 更小的窗口 Inception V2 diff v3 …

Dify数据库结构导出到PowerDesigner

即刻关注,获取更多 关注公众号 N学无止界 获取更多 Dify数据库结构导出到PowerDesigner Dify简介 Dify简介 欢迎使用 Dify Dify 是一款开源的大语言模型(LLM) 应用开发平台。它融合了后端即服务(Backend as Service)和 LLMOps 的理念&…

大数据中的电商数仓项目:探秘业务的核心

我学习完一个电商数仓的项目和电影实时推荐项目,便兴冲冲的去面试大数据开发岗,在面试的时候,面试官总是喜欢问,聊聊你为什么要做这个项目以及你这个项目有哪些业务? 我心想,为什么要做这个业务&#xff1f…

探究 Meme 的金融与社交属性

原文标题:《A Social and Financial Study of Memecoins》撰文:Andrew Hong编译:Chris,Techub News 每一个市场周期都伴随着 Meme 代币的出现。一群人围绕着某个 Meme 集结起来,暂时抬高了某个资产的价格(从…

多维时序 | Matlab实现SA-BP模拟退火算法优化BP神经网络多变量时间序列预测

多维时序 | Matlab实现SA-BP模拟退火算法优化BP神经网络多变量时间序列预测 目录 多维时序 | Matlab实现SA-BP模拟退火算法优化BP神经网络多变量时间序列预测效果一览基本介绍程序设计参考资料 效果一览 基本介绍 1.Matlab实现SA-BP模拟退火算法优化BP神经网络多变量时间序列预…

5G NR TAE TEST

环境配置: 测试TAE时,需要比对不同的Antenna Port之间的差异来测试 配置DL 2 layer MU的case layer1:通过设置weight,只有一个物理天线上有weight,其他天线上的weight为0,该天线的DMRS DMRS Port设置为1…

HCIP、补充 - 认识网络设备

认识网络设备 认识网络设备框式设备硬件模块网络设备逻辑架构业务报文转发处理流程转发信息 认识网络设备 框式设备硬件模块 主控板(MPU,Main Processing Unit):负责整个系统的控制平面和管理平面。 控制平面完成系统的协议处理、业务处理、路由运算、转…

【Linux】 管道扩展 — 开始使用命名管道

送给大家一句话: 人生有六个字,前面三个是不害怕,后面三个是不后悔。 -- 董卿 🔆🔆🔆🔆🔆🔆🔆🔆 命名管道的功能实现 1 命名管道的原理2 代码实…

佳能R6M2断电覆盖的恢复方法

佳能R6是佳能R系列中的一款高端机,最近两年佳能和索尼不断斗法,都号称自己的新机型能达到影视级,不过目前看貌似索尼更胜一筹。下边这个案例是文件拍摄时断电,结果变成0字节,然后覆盖了部分数据。 故障存储:128G存储卡…

CentOS7部署Yearning并配置MySQL数据库远程访问详细流程——“cpolar内网穿透”

文章目录 前言1. Linux 部署Yearning2. 本地访问Yearning3. Linux 安装cpolar4. 配置Yearning公网访问地址5. 公网远程访问Yearning管理界面6. 固定Yearning公网地址 前言 本文主要介绍在 Linux 系统简单部署 Yearning 并结合 cpolar 内网穿透工具实现远程访问,破除…

都在说的跨网文件共享系统是什么?企业该怎么甄选?

跨网文件共享系统成为越来越受关注的产品焦点,那么跨网文件共享系统是什么呢?跨网文件共享是指在不同网络之间共享文件的过程,使得不同网络中的用户可以访问和使用共享的文件。 原则上而言,不同网络间的文件是无法共享的&#xff…

家政预约小程序09小程序分享及海报分享

目录 1 设置弹窗2 制作海报总结 上一篇我们介绍了服务详情页面的开发,本篇介绍一下用户分享及海报分享的功能 1 设置弹窗 当用户点击分享按钮的时候,系统弹出弹窗界面,提供分享好友及分享海报的选项。选中页面组件,添加弹窗组件 …

ReDos攻击浅析

DOS为拒绝服务攻击,re则是由于正则表达式使用不当,陷入正则引擎的回溯陷阱导致服务崩溃,大量消耗后台性能 正则 ​ 探讨redos攻击之前,首先了解下正则的一些知识 执行过程 大体的执行过程分为: 编译 -> 执行编译过程中&…

ROS2从入门到精通2-1:launch多节点启动与脚本配置

目录 0 专栏介绍1 ROS2的启动脚本优化2 ROS2多节点启动案例2.1 C架构2.2 Python架构 3 其他格式的启动文件3.1 .yaml启动3.2 .xml启动 0 专栏介绍 本专栏旨在通过对ROS2的系统学习,掌握ROS2底层基本分布式原理,并具有机器人建模和应用ROS2进行实际项目的…

Redis 中的 Zset 数据结构详解

目录 用法 1. 增 2. 删 3. 查 4. 交,并 编码方式 应用场景 Redis 中的 Zset(有序集合)是一种将元素按照分数进行排序的数据结构。与上篇写的SetRedis 中的 Set 数据结构详解不同,Zset 中的每个元素都关联一个浮点数类型的…

QT C++ 基于word模板 在书签位置写入文字和图片

如果你有按模版批量自动化操作word文件的需求,那么本文能给你一定的帮助。 它能满足你程序自动化生成报表的需求。常常用于上位机、测试仪器的软件中。 需要你你自己做个word模版文档,添加2个书签。点按钮,会按照你的模板文档生成一个同样的…

如何使用 Midjourney 进行 UI/UX 设计

图片由Midjourney创建 UI/UX 设计中的 AI 艺术彻底改变了游戏规则,开辟了惊人的可能性。Midjourney 可以在几秒钟内启动大量设计选项,让您的工作变得更轻松、更快捷。 在本文中,我将向您展示一些为 UI/UX 设计创建 AI 艺术的技巧。 要事第…

TH方程学习(3)

一、编程实现 根据论文给出的案例&#xff0c;使用TH方程进行数值仿真 1.初始化条件 %% 参考文献<New State Transition Matrix for Relative Motion on an Aribitrary Elliptical Orbit> %% 作者 Yamanaka Koji clc;clear global miu Re miu 3.986e5; Re 6378.137;…

数据挖掘与机器学习——关联规则与协同过滤

目录 推荐算法的目的 如何进行推荐&#xff1a; 关联规则 关联规则挖掘&#xff1a; 应用&#xff1a; 案例&#xff1a;啤酒与尿布 定义&#xff1a; 关联规则的度量&#xff1a; 支持度 置信区间 度量 关联规则挖掘 定义 步骤 apriori算法 定律&#xff1a; …