13 Redis-- 数据一致性模型、MySQL 和 Redis 的数据一致性

news2024/10/6 16:28:39

数据一致性模型

根据一致性的强弱分类,可以将一致性模型按以下顺序排列:

强一致性 > 最终一致性 > 弱一致性

数据一致性模型一般用于分布式系统中,目的是定义多个节点间的同步规范。

在这里,我们将其引入数据库和缓存组成的存储系统中,在这个系统中,数据库和缓存就是两个节点。

我们将尝试采用不同的方案,实现这两个节点的同步状态。

此外,由于 MySQL 和 Redis 的广泛流行,我们这里可以把数据库 = MySQL,缓存 = Redis。

强一致性模型

强一致性模型要求在分布式系统中,所有节点对于某个数据项的值都是一致的。
即:所有读操作总能返回最新的写操作结果。

强一致性模型可以通过使用共享内存原子操作同步机制来实现。

最终一致性模型

允许在分布式系统中,不同节点可能对于某个数据项的值是不一致的,但是在某个时间点,所有节点对于某个数据项的值都会达到一致。
即:读操作不一定能返回最新的写操作结果。数据更新后,不保证立即一致,但保证在一定时间内最终一致。

最终一致性模型通常使用消息队列事件源异步机制来解决数据一致性问题。

弱一致性模型

弱一致性模型允许在分布式系统中,不同节点可能对于某个数据项的值是不一致的。

弱一致性模型通常使用版本号(version number)最近COMMIT时间戳等机制来解决数据一致性问题。

区别

  • 强一致性与弱一致性的区别

强一致性要求在分布式系统中,所有节点对于某个数据项的值是一致的。弱一致性允许在分布式系统中,不同节点可能对于某个数据项的值是不一致的。强一致性可以通过使用共享内存、锁等同步机制来实现,而弱一致性可以通过使用版本号、时间戳等机制来解决数据一致性问题。

  • 最终一致性和弱一致性的区别

弱一致性允许在分布式系统中,不同节点可能对于某个数据项的值是不一致的。最终一致性允许在分布式系统中,不同节点可能对于某个数据项的值是不一致的,但是在某个时间点,所有节点对于某个数据项的值都会达到一致。最终一致性可以通过使用消息队列、事件源等异步机制来解决数据一致性问题。

强一致性模型适用于需要高度一致性的场景,如银行转账、电子商务订单等。

弱一致性模型适用于需要高度可用性和扩展性的场景,如缓存、数据备份等。

最终一致性模型适用于需要实时性和弹性的场景,如实时数据分析、日志处理等。在选择数据一致性模型时,需要权衡应用场景的一致性、可用性、扩展性和实时性需

数据库和缓存的数据一致性

 - 过程一致性
	 - 第一种不一致:缓存和数据其中一者为空
	 - 第二种不一致:缓存和数据皆存在,但值不同。
	 - 
先抛一下结论:在满足实时性的条件下,不存在同时保证过程一致性和最终一致性的方案
最好的结果是第一种过程不一致 + 最终一致性方案。 

在满足实时性的前提下,不存在强一致性的方案,只有最终一致性方案。

事实上,除了秒杀余额交易等准确性要求高的业务外,其它业务并不追求强一致性。

在这里插入图片描述

不好的方案:每个请求都先写数据库,再写缓存

例如 :A请求在先,更新数据为10;B请求在后,更新数据为11。最终数据库和缓存中的变量应该都为 11。

至少应有四步,理想的顺序为

  1. 线程 A 执行 updateMySQL(10)。
  2. 线程 A 执行 updateRedis(10)。
  3. 线程 B 执行 updateMySQL(11)。
  4. 线程 B 执行 updateRedis(11)。

然而,As we all know:进程并发执行,其执行顺序并非固定。
理想的情况是 1234,但1324也是可能的。

最坏的情况,1342,即下图:
在这里插入图片描述
这种顺序下执行完四步,最终数据库为 11;缓存为 10。

不好的方案:每个请求都先写 Redis,再写 MS

与第一种方案出错的原因一致。
在这里插入图片描述

不好的方案:每个请求都先删除 Redis,再写 MS,最后写 Redis

这种方法可以达到最终 一致性,但可能由于过程不一致,被并发线程脏读。

请求 A 是更新请求,目标是将变量更新为 11
请求 B 是读请求
在这里插入图片描述
最初状态下:MS 和 Redis 都为 10。

  1. A请求第一步:删除缓存。此时 MS 为 10,缓存为空。
  2. B 查询变量的值,但是由于未命中缓存,查询 MS 得到 10。查询结果错误
  3. A请求第二步:更新 MS 11。此时 MS 为 11,缓存为空
  4. B 知道缓存中不存在,但 MS 中有,自然会写回 Redis,此时 MS 为 11,Redis 为 10。此时数据已经不一致了,任意线程此时查询,会查到错误的 10
  5. A请求第三步:更新 Redis 11。此时 MS 为 11,Redis 为 11。

【2】和【4】都是可能的脏读发生时机,【2】发生的可能更大,因为查询远快于更新。

好的方案:【缓存双删】每个请求都先删除 Redis,再写 MySQL,再删除 Redis

这个方案是对 “先删除 Redis,再写 MySQL” 的升级,因为在后者,存在最终一致性问题。
既然最终 MS 和 Redis 不一致,那干脆把 Redis 重新删除即可,这个也是大家常说的“缓存双删”。

A请求为更新请求,目标是将变量更新为 11
B请求为读请求,查询变量的值
在这里插入图片描述
最初状态下:MS 和 Redis 都为 10。

  1. A请求第一步:删除 Redis 中的变量10。此时 MS 为 10, Redis 为空
  2. B 查询变量的值,但是由于未命中缓存,查询 MS 得到 10
  3. A请求第二步:写 MS 为 11。此时 MS 为 11,Redis 空
  4. B 知道缓存中不存在,但 MS 中有,自然会写回 Redis,此时 MS 为 11,Redis 为 10。
  5. A请求第三步:删除 Redis 中的变量 10。此时 MS 为 11,Redis 为 空。

【2】和【4】都是可能的脏读发生时机,【2】发生的可能更大,因为查询远快于更新。

尝试改进【延时双删】每个请求都先删除 Redis,再写 MySQL,再延时删除 Redis

回看上一个方案的字部分-- 即时序图的第四步、第五步。

需要注意,第四步和第五步必须依次执行。

倘若先第五步: A请求第三步:删除 Redis 中的变量 10。此时 MS 为 11,Redis 为 空。
再第四步:B 知道缓存中不存在,但 MS 中有,自然会写回 Redis,此时 MS 为 11,Redis 为 10。

连最终一致性也不能保证了!这就是一个很坏的方案。

为了确保第四步第五步依次执行,不妨在执行第五步前,主动休眠 A请求一段时间,以确保最后执行。
这就是延时的地方。

但也并非完美,因为延时的时机如果掌控不好仍然会被脏读。

继续改进 使用消息队列

既然休眠总体第五步:定时延时删除缓存,不一定好用。

将这一步加入加入消息队列中,执行异步串行化删除。
在这里插入图片描述

好的方案:每个请求都先写 MS,再删除 Redis

在这里插入图片描述
【2】是可能的脏读发生时机

此外,在满足以下两个条件时,这种方案还可能出现另一种意外:

  • 请求B开始查询时,缓存刚好自动失效;
  • 请求 B 从数据库查出 10,回写缓存的耗时,比请求 A 写数据库,并且删除缓存的还长。
    在这里插入图片描述
    此时完全乱套了,数据库中的是错误的数据。

但注意,这种情况发生的条件之一是:请求 B 从数据库查出 10 的耗时 + 请求B 回写缓存的耗时 > 请求 A 写数据库 + 请求A 删除缓存的耗时

不等式左右两边各有一次数据库 + 一次缓存,但我们显然可知,左边查数据库的耗时,是远小于右边写数据库的耗时的

因此这一条件很难满足,极端情况发生的概率很小。

先写 MySQL,通过 Binlog,异步更新 Redis

这种方案,主要是监听 MySQL 的 Binlog,然后通过异步的方式,将数据更新到 Redis,这种方案有个前提,查询的请求,不会回写 Redis。
在这里插入图片描述
这个方案,会保证 MySQL 和 Redis 的最终一致性,但是如果中途请求 B 需要查询数据,如果缓存无数据,就直接查 DB;如果缓存有数据,查询的数据也会存在不一致的情况。

所以这个方案,是实现最终一致性的终极解决方案,但是不能保证实时性。

定论

  • 先写 Redis,再写 MySQL

这种方案,我肯定不会用,万一 DB 挂了,你把数据写到缓存,DB 无数据,这个是灾难性的;
我之前也见同学这么用过,如果写 DB 失败,对 Redis 进行逆操作,那如果逆操作失败呢,是不是还要搞个重试?

  • 先写 MySQL,再写 Redis

对于并发量、一致性要求不高的项目,很多就是这么用的,我之前也经常这么搞,但是不建议这么做;
当 Redis 瞬间不可用的情况,需要报警出来,然后线下处理。

  • 先删除 Redis,再写 MySQL

这种方式,我还真没用过,直接忽略吧。

  • 先删除 Redis,再写 MySQL,再删除 Redis

这种方式虽然可行,但是感觉好复杂,还要搞个消息队列去异步删除 Redis。

  • 先写 MySQL,再删除 Redis

比较推荐这种方式,删除 Redis 如果失败,可以再多重试几次,否则报警出来;
这个方案,是实时性中最好的方案,在一些高并发场景中,推荐这种。

  • 先写 MySQL,通过 Binlog,异步更新 Redis

对于异地容灾、数据汇总等,建议会用这种方式,比如 binlog + kafka,数据的一致性也可以达到秒级;
纯粹的高并发场景,不建议用这种方案,比如抢购、秒杀等。

个人结论:

实时一致性方案:采用“先写 MySQL,再删除 Redis”的策略,这种情况虽然也会存在两者不一致,但是需要满足的条件有点苛刻,所以是满足实时性条件下,能尽量满足一致性的最优解。
最终一致性方案:采用“先写 MySQL,通过 Binlog,异步更新 Redis”,可以通过 Binlog,结合消息队列异步更新 Redis,是最终一致性的最优解。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1886031.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

生命在于学习——Python人工智能原理(3.1.2)

一、概率基本知识 1.3 常见概型 1.3.1 古典概型 定义1 古典概型 若随机事件E满足如下两个条件: (1)样本空间S中只有有限个样本点。 (2)样本空间S中每个样本点发生都是等可能的。 这样的随机试验称为古典概型。 P(A)…

深入剖析高并发服务架构设计的探索与性能分析(1)

深入剖析多线程、协程与事件驱动IO模型的探索与性能分析 Web并发应用场景网站(Website)并发处理场景特点复杂业务逻辑功能点与页面处理高效应对IO并发需求缓存优化处理控制 大浏览量系统的静态改造静态系统通常有如下几方面的特征几种静态化方案的设计及…

人工智能 (AI) 基本概念 入门篇【C#】版

1. 什么是人工智能? 人工智能(Artificial Intelligence, AI)是指计算机系统能够执行通常需要人类智能的任务,如视觉识别、语音识别、决策和语言翻译等。AI的核心是通过算法和数据进行学习和推理,以实现智能行为。 2.…

前端修改audio背景色

1.查看浏览器设置Show user agent shadow DOM是否打开 2.打开可以查看audio Dom /** 去掉默认的背景颜色 */ audio::-webkit-media-controls-enclosure{background-color:unset; } 3.效果图

寻找最适合你的交易风格

与Eagle Trader一起,您将拥有一位坚不可摧的合作伙伴,为您的交易之路增添坚实信心,并重塑交易体验的每一个细节。我们量身定制的交易环境,更能让您精准捕捉并驾驭符合您独特交易风格的卓越条件,让交易之旅更加自由畅快…

软考高级-系统分析师知识点100条速记!

宝子们!上半年软考已经结束一段时间了,准备备考下半年软考高级-系统分析师的小伙伴可以开始准备了,毕竟高级科目的难度可是不低的,相信参加过上半年系分的小伙伴深有体会。 这里给大家整理了100条系分知识点,涵盖全书9…

Mybatis1(JDBC编程和ORM模型 MyBatis简介 实现增删改查 MyBatis生命周期)

目录 一、JDBC编程和ORM模型 1. JDBC回顾 2. JDBC的弊端 3. ORM模型 Mybatis和hibernate 区别: 4. mybatis 解决了jdbc 的问题 二、MyBatis简介 1. MyBatis快速开始 1.1 导入jar包 1.2 引入 mybatis-config.xml 配置文件 1.3 引入 Mapper 映射文件 1.3 测试 …

Charles抓包工具踩坑记录

请添加图片描述 Charles抓包工具 证书问题 输入网址:chls.pro/ssl 第一个下载证书网址,会出现一直加载不出来,无法下载证书的情况 解决:选择下面save Charles Root。。。 2 证书在mac中禁止修改问题 解决也很简单,按照…

计算机视觉概述

The main role of computer vision is to get information through input images. 1、Overview 计算机视觉中关于图像识别有四大类任务: (1)分类-Classification:解决“是什么?”的问题,即给定一张图片或…

【Linux详解】进程地址空间

目录 研究背景 验证地址空间 实验一:父子进程变量地址一致性 实验二:变量值修改后父子进程的差异 分析与结论 实验三:进程地址空间验证 理解进程地址空间 区域与页表 写时拷贝机制 进程地址空间的意义 文章手稿: xmind…

企业需要部署OV证书吗?

一、什么是OV证书? OV证书,即组织验证型SSL/TLS证书。它是网络安全领域中使用的一种证书,在为网站或应用提供中等级别的安全性和可信度。相比于基本的域名验证(DV)证书,OV证书经历了更为严格和全面的验证过…

基于微信小程序的优鲜易购平台设计与实现

系统摘要 随着网络科技的迅速发展以及社会大众消费习惯的转变,微信小程序逐渐以其便捷性和易用性引起了人们的广泛关注。本文意在研发设计并实现一种基于微信小程序开发的优鲜商品易购系统,即一个专注于生鲜产品网上选购服务的买菜网站,利用SpringBoot和Vue.js的技术栈…

SQL语言基础特点、数据库系统

一、SQL的概述 (1) SQL全称: Structured Query Language,是结构化查询语言,用于访问和处理数据库的标准的计算机语言。 (2)SQL语言1974年由Boyce和Chamberlin提出,并首先在IBM公…

控制台厂商配额查询

概述 厂商推送限制 每个厂商通道都有对应的厂商配额和 QPS 限制,当请求超过限制且已配置厂商回执时,MobPush会采取以下措施: 当开发者推送请求超过厂商配额时,MobPush将通过自有通道进行消息下发。当开发者推送请求超过厂商 QPS…

TB67S539FTG:先进的2相双极步进电机驱动器

东芝的TB67S539FTG是一款高性能PWM斩波型2相双极步进电机驱动器,旨在满足现代工程应用的严格需求。本文将深入介绍其主要特性、技术规格和功能优势,为潜在客户提供全面的见解,说明为什么TB67S539FTG在市场上独树一帜。 主要特性 先进电流检测…

消息中间件ApacheKafka在windows简单安装

一.背景 之前公司需要API网关管理软件ApacheShenYu,我相信把调用的记录都存到一个数据库。他支持日志推送到kafka,所以,我准备尝试一下通过kafka接收调用的日志信息。第一步,当然是安装kafka了。 二.ApacheKafka的下载 打开下载…

【51单片机入门】速通定时器

文章目录 前言定时器是什么初始化定时器初始化的大概步骤TMOD寄存器C/T寄存器 触发定时器中断是什么中断函数定时器点亮led 总结 前言 在嵌入式系统的开发中,定时器是一个非常重要的组成部分。它们可以用于产生精确的时间延迟,或者在特定的时间间隔内触…

构建RAG+nebula graph(知识图谱KG)

目标:通过利用 LlamaIndex 和 NebulaGraph 为费城费城人队(Philadelphia Phillies)构建一个RAG流程,深入探讨知识图谱。 NebulaGraph 是市场上最好的知识图谱数据库之一。它是开源的、分布式的,并且能够处理具有亿万边…

【postgresql】 数据类型

数字类型 名字存储尺寸描述范围smallint2字节小范围整数-32768 ~32767integer4字节整数的典型选择-2147483648 ~ 2147483647bigint8字节大范围整数-9223372036854775808 ~ 9223372036854775807decimal可变用户指定精度,精确最高小数点前131072位,以及小…

Centos7部署Mysql8.0超级详细教程,一看就会!

1、准备 下载 Mysql 安装包源信息,去到这个网址,https://dev.mysql.com/downloads/repo/yum/ 复制红色框的内容, 2、开始安装 # 以下所有操作建议切换到 root 用户后运行。。yum install wget -y# 将上面的复制内容粘贴到后面,格式&…