关于Redis缓存一致性问题的优化和实践

news2024/11/16 19:43:17

目录标题

  • 导语
  • 正文
    • 分布式场景下无法做到强一致
    • 即使是达到最终一致性也很难
      • 缓存的一致性问题
      • 缓存是如何写入的
    • 如何感知数据库的变化
    • 最佳实践一:数据库变更后失效缓存
    • 最佳实践二:带版本写入
  • 总结与展望
    • 阿里XKV
    • 腾讯DCache

导语

Redis缓存一致性的问题是经常遇到的问题,关于redis的优化有很多种,今天给大家介绍的是得物电商中对redis的优化和实战,希望能给大家带来一些启迪。

正文

最近团队里我们在密集的讨论Redis缓存一致性相关的问题,电商核心的域如商品、营销、库存、订单等实际上在缓存的选择上各有特色,那么在这些差异的业务背后,我们有没有一些最佳实践可供参考呢?

本文尝试着来讨论这个问题,并给出一些建议。

在讨论之前,有两个重点我们需要达成一致:

分布式场景下无法做到强一致

  • 不同于CPU硬件缓存体系采用的MESI协议以及硬件的强时钟控制,分布式场景下我们无法做到缓存与底层数据库的强一致,即把缓存和数据库的数据变更做成一个原子操作。
  • 硬件工程师设计了内存屏障(Memory Barrier)的概念,提供给软件开发者不同的一致性选项在性能与一致性上进行权衡。

即使是达到最终一致性也很难

  • 分布式场景下,要做到最终一致性,就要求缓存中存储的是最新版本的数据(或者缓存为空),而且是在数据库更新后很迅速的就要达到这个一致性的状态,要做到是极其困难的。
  • 我们会面临硬件、软件、通信等等组件非常多的异常情况。

在这里插入图片描述

缓存的一致性问题

一般化来说,我们面临的是这样的一个问题,如下图所示,数据库的数据会有5次更新,产生6个版本,V1~V6,图中每个方框的长度代表这个版本持续的时间。

我们期望,在数据库中的数据变化后,缓存层需要尽快的感知到并作出反应,如下图所示,缓存层方框中的间隔代表这个时间段缓存数据不存在,V2、V3以及V5版本在缓存中不存在并不会破坏我们的最终一致性要求,只要数据库的最终版本和缓存的最终版本是相同的就可以了。

[图片链接]

缓存是如何写入的

缓存写入的代码通常情况下都是和缓存使用的代码放在一起的,包含4个步骤,如下图所示:W1读取缓存,W2判断缓存是否存在,W3组装缓存数据(这通常需要向数据库进行查询),W4写入缓存。

每一个步骤间可能会停顿多久是没有办法控制的,尤其是W3、W4之间的停顿最为要命,它很可能让我们将旧版本的数据写入到缓存中。

我们可能会想,W4步的写入,带上W2的假设,即使用WriteIfNotExists语义,会不会有所改善?

[图片链接]

考虑如下的情形,假设有3个缓存写入的并发执行,由于短时间数据库大量的更新,它们分别组装的是V1、V2、V3版本的数据。

使用WriteIfNotExists语义,其中必然有2个执行会失败,哪一个会成功根本无法保证。

我们无法简单的做决策,需要再次将缓存读取出来,然后判断是否我们即将写入的一样,如果一样那就很简单;如果不一样的话,我们有两种选择:

  • 将缓存删除,让后续别的请求来处理写入。
  • 使用缓存提供的原子操作,仅在我们的数据是较新版本时写入。

[图片链接]

如何感知数据库的变化

数据库的数据发生变化后,我们如何感知到并进行有效的缓存管理呢?

通常情况下有如下的3种做法:

  1. 使用代码执行流
    通常我们会在数据库操作完成后,执行一些缓存操作的代码。这种方式最大的问题是可靠性不高,应用重启、机器意外当机等情况都会导致后续的代码无法执行。

  2. 使用事务消息作为使用代码执行流的改进
    在数据库操作完成后发出事务消息,然后在消息的消费逻辑里执行缓存的管理操作。可靠性的问题就解决了,只是业务侧要为此增加事务消息的逻辑,以及运行成本。

  3. 使用数据变更日志
    数据库产品通常都支持在数据变更后产生变更日志,比如MySQL的binlog。可以让中间件团队写一款产品,在接收到变更后执行缓存的管理操作,比如阿里的精卫。可靠性有保证,同时还可以进行某个时间段变更日志的回放,功能就比较强大了。

最佳实践一:数据库变更后失效缓存

这是最常用和简单的方式,应该被作为首选的方案,整体的执行逻辑如下图所示:

[图片链接]

W4步使用最基本的put语义,这里的假设是写入较晚的请求往往也是携带的最新的数据,这在大多的情形下都是成立的。D1步使用监听DB binlog的方式来删除缓存,即前述使用数据变更日志中介绍的方法。

这个方案的缺点是:在数据库数据存在高并发更新且缓存读取流量较大的情况下,会有小概率存在缓存中存储的是旧版本数据的情况。

通常的解法有四种:

  1. 限制缓存有效时间:设定缓存的过期时间,比如15分钟。即表示我们最多接受缓存在15分钟的时间范围内是旧的。

  2. 小概率缓存重加载:根据流量比设定一定比例的缓存重加载,以保证大流量情况下的缓存数据的一致性。比如1%的比例,这同时还可以帮助数据库得到充分的预热。

  3. 结合业务特点:

    • 针对营销的场景:在商品详情页/确认订单页的优惠计算时使用缓存,而在下单时不使用缓存。这可以让极端情况发生时,不产生过大的业务损失。
    • 针对库存的场景:读取到旧版本的数据只是会在商品已售罄的情况下让多余的流量进入到下单而已,下单时的库存扣减是操作数据库的,所以不会有业务上的损失。
  4. 两次删除:D1步删除缓存的操作执行两次,且中间有一定的间隔,比如30秒。这两次动作的触发都是由“缓存管理组件”发起的,所以可以由它支持。

最佳实践二:带版本写入

针对商品信息缓存这种更新频率低、数据一致性要求较高且缓存读取流量很高的场景,通常会采用带版本更新的方式,整体的执行逻辑如下图如示:

[图片链接]

和“数据库变更后失效缓存”方案最大的差异在W4步和D1步,需要缓存层提供带版本写入的API,即仅当写入数据版本较新时可以写入成功,否则写入失败。

这同时也要求我们在数据库增加数据版本的信息。

这个方案的最终一致性效果比较好,仅在极端情况下(新版本写入后数据丢失了,后续旧版本的写入就会成功)存在缓存中存储的是旧版本数据的可能。

在D1步使用写入而不是使用删除可以极大程度的避免这个极端情况的出现,同时由于该方案适用于缓存读取流量很高的场景,还可以避免缓存被删除后W3步短时间大量请求穿透到DB。

总结与展望

对于缓存与数据库分离的场景,在结合了业界多家公司的实践经验以及ROI权衡之后,前述的两个最佳实践是被应用的最为广泛的,尤其是最佳实践一,应该作为我们日常应用的首选。同时,为了最大限度的避免每个最佳实践背后可能发生的不一致性问题,我们还需要切合业务的特点,在关键的场景上做一些保障一致性的设计(比如前述的营销在下单时使用数据库读而不是缓存读),这也显得尤为重要(毕竟如“背景”中所述,并不存在完美的技术方案)。

除了缓存与数据库分离的方案,还有两个业界已经应用的方案也值得我们借鉴:

阿里XKV

简单来讲就是在数据库上部署一个Memcache的Server,它直接绕过数据库层直接访问存储引擎层(如:InnoDB),同时使用KV client来进行数据的访问。它的特点是数据实际上与数据库是强一致的,性能可以比使用SQL访问数据库提升5~10倍。缺点也很明显,只能通过主键或者唯一键来访问数据(这只是相对SQL来说的,大多数缓存本来也就是KV访问协议)。

腾讯DCache

不用自行维护缓存与数据库两套存储,给开发人员统一的一套数据视图,由DCache在缓存更新后自行持久化数据。缺点是支持的数据结构有限(key-value,k-k-row,list,set,zset),未来也很难支持形如数据库表一样复杂的数据结构。

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2133708.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

大模型→世界模型下的「认知流形」本质·下

本篇内容节选自今年初我撰写的那篇10万的文章《融合RL与LLM思想,探寻世界模型以迈向AGI》,其观点也是文章中核心中的核心。 想进一步完整阅读的小伙伴可关注评论,节选内容如下↓ 接上篇..“因此当前无论对先验自回归学习下的LLMs也好还是未来…

ASR(自动语音识别)识别文本效果的打分总结

ASR(自动语音识别)识别文本效果的打分总结 1. 词错误率(WER, Word Error Rate)2. 字正确率(W.Corr, Word Correct)3. 编辑距离(Edit Distance)4. 特定错误率5. 句子错误率(SER, Sentence Error Rate)6. 基于模型的评估方法对于ASR(自动语音识别)识别文本效果的打分…

【python】python中非对称加密算法RSA实现原理与应用实战

✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯,先赞后看哦~🎈🎈 🏆 作者简介:景天科技苑 🏆《头衔》:大厂架构师,华为云开发者社区专家博主,…

9.13 DFSBFS 简单 101 Symmetric Tree 104 Maximum Depth of Binary Tree

101 Symmetric Tree class Solution { public:// 比较两个向量是否镜像对称bool isIdentical(const std::vector<int>& n1, const std::vector<int>& n2) {int n n1.size();for (int i 0; i < n; i) {if (n1[i] ! n2[n - i - 1]) return false; // 镜…

AV1 Bitstream Decoding Process Specification--[2]:符号和缩写术语

原文地址&#xff1a;https://aomediacodec.github.io/av1-spec/av1-spec.pdf没有梯子的下载地址&#xff1a;AV1 Bitstream & Decoding Process Specification摘要&#xff1a;这份文档定义了开放媒体联盟&#xff08;Alliance for Open Media&#xff09;AV1视频编解码器…

通过LiveGBS实现安防监控摄像头GB28181转成WebRTC流实现web浏览器网页无插件低延迟直播...

目录 1、WebRTC超低延时直播2、WebRTC延时对比3、LiveGBS的低延时的WebRTC流4、分屏页面如何选择默认播放流5、无法播放Webrtc6、搭建GB28181视频直播平台 1、WebRTC超低延时直播 需要低延时的视频流监控播放&#xff0c;之前可以用rtmp的低延时播放(1秒左右)&#xff0c;随着浏…

三星ZFlip5/ZFlip4/W7024刷安卓14国行OneUI6.1系统-高级设置-韩/欧/港版

三星ZFlip5/ZFlip4/W7024系列手机&#xff0c;基本都是高端玩家的一个产品&#xff0c;目前虽然国内销量不 如其他品牌&#xff0c;但依旧表现不错&#xff0c;并且大家都不知道三星全球第一&#xff0c;自然在国外销量也比较OK 由于三星全部设备基本都支持解锁BL&#xff08;美…

Spring Boot基础

项目创建 项目启动 请求响应 RestController 1.返回值处理 RestController&#xff1a;这个注解结合了Controller和ResponseBody的功能。它默认将所有处理请求的方法的返回值直接作为响应体内容返回&#xff0c;主要用于构建RESTful API。返回的数据格式通常是JSON或XML&…

vue使用TreeSelect设置带所有父级节点的回显

Element Plus的el-tree-select组件 思路&#xff1a; 选中节点时&#xff0c;给选中的节点赋值 pathLabel&#xff0c;pathLabel 为函数生成的节点名字拼接&#xff0c;数据源中不包含。 在el-tree-select组件中设置 props“{ label: ‘pathLabel’ }” 控制选中时input框中回…

商务办公tips1:如何将网页转换为pdf

​ 场景需求&#xff1a; 商务轻办公人士获取网页内容&#xff0c;并且最好是pdf版本&#xff1f; 将网页转换为PDF的需求可能出现在多种场景中&#xff0c;以下是一些可能的情况&#xff1a; 学术研究&#xff1a;研究人员可能需要将某个学术网站的全文内容保存为PDF格式&a…

sqlgun靶场训练

1.看到php&#xff1f;id &#xff0c;然后刚好有个框&#xff0c;直接测试sql注入 2.发现输入1 union select 1,2,3#的时候在2处有回显 3.查看表名 -1 union select 1,group_concat(table_name),3 from information_schema.tables where table_schemadatabase()# 4.查看列名…

【计网】从零开始使用UDP进行socket编程 --- 客户端与服务端的通信实现

人生不过如此&#xff0c;且行且珍惜。 自己永远是自己的主角&#xff0c; 不要总在别人的戏剧里充当着配角。 --- 林语堂 --- 从零开始学习socket编程---UDP协议 1 客户端与服务端的通信2 设计UDP服务器类2.1 基础框架设计2.2 初始化函数2.3 启动函数 3 设计客户端 1 客户…

会员计次卡渲染技术-—SAAS本地化及未来之窗行业应用跨平台架构

一、计次卡应用 1. 健身中心&#xff1a;会员购买一定次数的健身课程或使用健身房设施的权限。 2. 美容美发店&#xff1a;提供一定次数的理发、美容护理等服务。 3. 洗车店&#xff1a;车主购买若干次的洗车服务。 4. 儿童游乐场&#xff1a;家长为孩子购买固定次数的入场游…

分类预测|基于差分优化DE-支持向量机数据分类预测完整Matlab程序 DE-SVM

分类预测|基于差分优化DE-支持向量机数据分类预测完整Matlab程序 DE-SVM 文章目录 一、基本原理DE-SVM 分类预测原理和流程总结 二、实验结果三、核心代码四、代码获取五、总结 一、基本原理 DE-SVM 分类预测原理和流程 1. 差分进化优化算法&#xff08;DE&#xff09; 原理…

跟《经济学人》学英文:2024年09月07日这期 How fashion conquered television

How fashion conquered television More and more shows celebrate fancy clothes. Often brands call the shots 原文&#xff1a; From Tokyo to Seoul, on to New York, London, Milan and Paris, there are more “fashion weeks” in September than there are weeks i…

【Pandas操作2】groupby函数、pivot_table函数、数据运算(map和apply)、重复值清洗、异常值清洗、缺失值处理

1 数据清洗 #### 概述数据清洗是指对原始数据进行处理和转换&#xff0c;以去除无效、重复、缺失或错误的数据&#xff0c;使数据符合分析的要求。#### 作用和意义- 提高数据质量&#xff1a;- 通过数据清洗&#xff0c;数据质量得到提升&#xff0c;减少错误分析和错误决策。…

sharding-jdbc metadata load优化(4.1.1版本)

背景 系统启动时&#xff0c;会注意sharding-jdbc提示加载metadata 于是想看看里面做了什么事情 问题追踪 debug后可以观察走到了该类 org.apache.shardingsphere.shardingjdbc.jdbc.core.context.ShardingRuntimeContext#loadSchemaMetaData 先看这个shardingRuntimeConte…

玉米种子质量检测系统源码分享

玉米种子质量检测检测系统源码分享 [一条龙教学YOLOV8标注好的数据集一键训练_70全套改进创新点发刊_Web前端展示] 1.研究背景与意义 项目参考AAAI Association for the Advancement of Artificial Intelligence 项目来源AACV Association for the Advancement of Computer…

数据结构——栈和队列(队列的定义、顺序队列以及链式队列的基本操作)

目录 队列&#xff08;queue&#xff09;的定义 顺序队——队列的顺序表示和实现 顺序队列&#xff08;循环队列&#xff09;的类型定义 顺序队列上溢问题的解决方法 ​编辑 循环队列的基本操作 队列的基本操作——队列的初始化 队列的基本操作——求队列的长度 队列的…

[数据集][目标检测]岩石种类检测数据集VOC+YOLO格式4766张9类别

数据集格式&#xff1a;Pascal VOC格式YOLO格式(不包含分割路径的txt文件&#xff0c;仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数)&#xff1a;4766 标注数量(xml文件个数)&#xff1a;4766 标注数量(txt文件个数)&#xff1a;4766 标注…