Redis缓存雪崩、击穿、穿透、双写一致性、并发竞争、热点key重建优化、BigKey的优化 等解决方案

news2024/10/6 18:32:42

一. 缓存雪崩

1. 含义

 同一时刻,大量的缓存同时过期失效。

2. 产生原因和后果

(1). 原因:由于开发人员经验不足或失误,大量热点缓存设置了统一的过期时间。

(2). 产生后果:恰逢秒杀高峰,缓存过期,瞬间海量的QPS(每秒查询次数)直接打到DB上,如果系统架构没有熔断机制,直接将导致系统全线崩溃。

3. 处理方案

(1). 设置不同的缓存失效时间,比如可以在缓存过期时间后面加个随机数,这样就避免同一时刻缓存大量过期失效。

setRedis(key,value,time + Math.random() * 9999);

(2). 针对系统的一些热点数据, 可以设置缓存永不过期。 (或者定时更新)

(3). 设置二级缓存架构C1、C2,C1在前,C2在后,C1的缓存可以设置不同的过期时间,C2缓存与DB保持强一致性,实现数据同步。

PS:该二级缓存架构,同样也适用于解决下面的缓存击穿。

(4). 从架构层面来说:Redis做集群,将热点数据分配在不同的master上,减轻单点压力,同时master要对应多个slave,保证高可用; 系统架构要有快速熔断策略,减轻系统的压力。

二. 缓存击穿

1. 含义

 某热点Key扛着大量的并发请求,当key失效的一瞬间,大量的QPS打到DB上,导致系统瘫痪。

PS:缓存击穿和缓存雪崩类似,击穿是某些热点key失效一瞬间大量请求打到DB上,缓存雪崩是指缓存面积失效导致大量请求打到DB上。所以二者的处理方案类似。

2. 处理方案

(1). 热点key过期时间后加随机数 。

(2). 热点key缓存永不过期(但是value需要开个子线程去更新)

(3). 二级缓存架构策略。(详见上面)

(4). 采用互斥锁更新,保证同一进程针对相同的数据不会并发打到DB上,从而减轻DB的压力。

(5). 缓存失效的时候随机sleep一个很短的时间,再次查询,如果失败则执行更新操作。

三. 缓存穿透

1. 含义

 业务请求中数据缓存中没有,DB中也没有,导致类似请求直接跨过缓存,反复在DB中查询,与此同时缓存也不会得到更新。

举个例子:

 商品表中的id是自增,并且以id为缓存的key,商品库存为value事先存在redis中。但此时过来的请求id均为负数,-1,-2,-3,缓存没有,DB中也没有,造成类似请求直接跨过缓存,打在DB上。

2.处理方案

(1). cache null策略:DB查询的结果即使为null,也给缓存的value设置为null,同时可以设置一个较短的过期时间,这样就避免不存在的数据跨过缓存直接打到DB上。

伪代码思路分享:

Public String get(String key) {
  //从缓存中获取数据
  String cacheValue = cache.get(key);
  //缓存为空
  if (StringUtils.isBlank(cacheValue)) {
     // 从DB中获取
     String storageValue = db.get(key);
     cache.set(key, storageValue);
     //如果存储数据为空,需要设置一个过期时间(300秒)
     if (storageValue == null) {
        cache.expire(key, 60 * 5);
      }
     return storageValue;
  } else {
     // 缓存非空
     return cacheValue;
   }
 }

剖析:

 该方案不是并不是最佳方案,还是上面的例子,比如我用不同的id进行请求,例如 id=-1,-2,。。。。-10000,会导致缓存中存在大量的null,当数量达到一定值的时候,根据缓存淘汰策略,会导致正常的key失效。

(2). 布隆过滤器:

 事先把存在的key都放到redis的BloomFilter 过滤器中,他的用途就是存在性检测,如果 BloomFilter 中不存在,那么数据一定不存在;如果 BloomFilter 中存在,实际数据也有可能会不存在。

剖析:

 布隆过滤器可能会误判,当不影响整体,所以目前该方案是处理此类问题最佳方案。

更多C++后台开发技术点知识内容包括C/C++,Linux,Nginx,ZeroMQ,MySQL,Redis,MongoDB,ZK,流媒体,音视频开发,Linux内核,TCP/IP,协程,DPDK多个高级知识点。

C/C++Linux服务器开发高级架构师/C++后台开发架构师​免费学习地址

【文章福利】另外还整理一些C++后台开发架构师 相关学习资料,面试题,教学视频,以及学习路线图,免费分享有需要的可以点击领取

四. 双写一致性

1. 含义

 双写一致性的含义就是:保证缓存中的数据 和 DB中数据一致。

2. 单线程下的解决方案

 单线程下实际上就是指并发不大,或者说对 缓存和DB数据一致性要求不是很高的情况。

 该问题就是经典的:缓存+数据库读写的模式,就是 Cache Aside Pattern

解决思路:

(1). 查询的时候,先查缓存,缓存中有数据,直接返回;缓存中没有数据,去查询数据库,然后更新缓存。

(2). 更新DB的后,删除缓存。

剖析:

(1). 为什么更新DB后,是删除缓存,而不是更新缓存呢?

 举个例子,比如该DB更新的频率很高,比如1min中内更新100次把,如果更新缓存,缓存也对应了更新了100次,但缓存在这一分钟内根本没被调用,或者说该缓存10min才可能会被查询一次,那么频繁更新缓存是不是就产生了很多不必要的开销呢。

 所以我们这里的思路是:用到缓存的时候,才去计算缓存

(2). 该方案高并发场景下是否适用?

 不适用

 比如更新DB后,还有没有来得及删除缓存,别的请求就已经读取到缓存的数据了,此时读取的数据和DB中的实际的数据是不一致的。

3. 高并发下的解决方案

 使用内存队列解决,把 读请求 和 写请求 都放到队列中,按顺序执行(即串行化的方式解决)。(要定义多个队列,不同的商品放到不同的队列中,换言之,同一个队列中只有一类商品)

剖析:

 这种方案也有弊端,当并发量高了,队列容易阻塞,这个队列的位置,反而成了整个系统的瓶颈了,所以说100%完美的方案不存在,只有最适合的方案,没有最完美的方案。

五. 并发竞争

1. 含义

 多个微服务系统要同时操作redis的同一个key,比如正确的顺序是 A→B→C,A执行的时候,突然网络抖动了一下,导致B,C先执行了,从而导致整个流程业务错误。

2. 解决方案

 引入分布式锁(zookeeper 或 redis自身)

 每个系统在操作之前,都要先通过 Zookeeper 获取分布式锁,确保同一时间,只能有一个系统实例在操作这个个 Key,别系统都不允许读和写。

六. 热点缓存key的重建优化

1. 背景

 开发人员使用“缓存+过期时间”的策略既可以加速数据读写, 又保证数据的定期更新, 这种模式基本能够满足绝大部分需求。 但是有两个问题如果同时出现, 可能就会对应用造成致命的危害:

  (1). 当前key是一个热点key(例如一个热门的娱乐新闻),并发量非常大。

  (2). 重建缓存不能在短时间完成, 可能是一个复杂计算, 例如复杂的SQL、 多次IO、 多个依赖等。

 在缓存失效的瞬间, 有大量线程来重建缓存, 造成后端负载加大, 甚至可能会让应用崩溃。

2. 解决方案

 要解决这个问题主要就是要避免大量线程同时重建缓存

 我们可以利用互斥锁来解决,此方法只允许一个线程重建缓存, 其他线程等待重建缓存的线程执行完, 重新从缓存获取数据即可。

代码思路分享:

String get(String key) {
 // 从Redis中获取数据
 String value = redis.get(key);
 // 如果value为空, 则开始重构缓存
 if (value == null) {
  // 只允许一个线程重建缓存, 使用nx, 并设置过期时间ex
  String mutexKey = "mutext:key:" + key;
  if (redis.set(mutexKey, "1", "ex 180", "nx")) {
    // 从数据源获取数据
    value = db.get(key);
    // 回写Redis, 并设置过期时间
    redis.setex(key, timeout, value);
    // 删除key_mutex
    redis.delete(mutexKey);
  }
  else {
  //其它线程休息50ms,重写递归获取
  Thread.sleep(50);
  get(key);
  }
}
  return value;
}

七. BigKey的危害及优化

1. 什么是BigKey

 在Redis中,一个字符串最大512MB,一个二级数据结构(例如hash、list、set、zset)可以存储大约40亿个(2^32-1)个元素,但实际中如果下面两种情况,我就会认为它是bigkey。

 (1). 字符串类型:它的big体现在单个value值很大,一般认为超过10KB就是bigkey。

 (2). 非字符串类型:哈希、列表、集合、有序集合,它们的big体现在元素个数太多。

 一般来说,string类型控制在10KB以内,hash、list、set、zset元素个数不要超过5000。反例:一个包含200万个元素的list。非字符串的bigkey,不要使用del删除,使用hscan、sscan、zscan方式渐进式删除,同时要注意防止bigkey过期时间自动删除问题(例如一个200万的zset设置1小时过期,会触发del操作,造成阻塞)

2. BigKey的危害

 (1). 导致redis阻塞

 (2). 网络拥塞

 bigkey也就意味着每次获取要产生的网络流量较大,假设一个bigkey为1MB,客户端每秒访问量为1000,那么每秒产生1000MB的流量,对于普通的千兆网卡(按照字节算是128MB/s)的服务器来说简直是灭顶之灾,而且一般服务器会采用单机多实例的方式来部署,也就是说一个bigkey

可能会对其他实例也造成影响,其后果不堪设想。

 (3). 过期删除

 有个bigkey,它安分守己(只执行简单的命令,例如hget、lpop、zscore等),但它设置了过期时间,当它过期后,会被删除,如果没有使用Redis 4.0的过期异步删除(lazyfree-lazy-expire yes),就会存在阻塞Redis的可能性。

3. BigKey的产生

 一般来说,bigkey的产生都是由于程序设计不当,或者对于数据规模预料不清楚造成的,来看几个例子:

 (1) 社交类:粉丝列表,如果某些明星或者大v不精心设计下,必是bigkey。

 (2) 统计类:例如按天存储某项功能或者网站的用户集合,除非没几个人用,否则必是bigkey。

 (3) 缓存类:将数据从数据库load出来序列化放到Redis里,这个方式非常常用,但有两个地方需注意:第一,是不是有必要把所有字段都缓存;第二,有没有相关关联的数据,有的同学为了图方便把相关数据都存一个key下,产生bigkey。

4. BigKey的优化

(1). 拆

 big list: list1、list2、...listN

 big hash:可以将数据分段存储,比如一个大的key,假设存了1百万的用户数据,可以拆分成200个key,每个key下面存放5000个用户数据

(2). 合理采用数据结构

 如果bigkey不可避免,也要思考一下要不要每次把所有元素都取出来(例如有时候仅仅需要hmget,而不是hgetall),删除也是一样,尽量使用优雅的方式来处理.

反例:

set user:1:name tom set user:1:age 19 set user:1:favor football

推荐hash存对象:

hmset user:1 name tom age 19 favor football

(3). 控制key的生命周期,redis不是垃圾桶。

 建议使用expire设置过期时间(条件允许可以打散过期时间,防止集中过期)。

原文链接:第三节:Redis缓存雪崩、击穿、穿透、双写一致性、并发竞争、热点key重建优化、BigKey的优化 等解决方案

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/73697.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

核心竞争力决定未来,中国社会科学院与美国杜兰大学金融管理硕士项目为你助力

随着社会发展的日新月异,知识更新迭代更是以秒来计算,我们不得不为自身有限的技能和认知而焦虑。面对新的机遇最好的应对方法就是要有学习能力,永远学习,终身学习,这是别人永远都抢不走的竞争力。身在金融领域的你&…

关于flex布局和九宫格布局的实现

1.父容器常见属性 display:flex (项目在主轴上的排列方式) justify-content:flex-start / flex-end / center / space-around / space-between (项目在交叉轴上的排列方式) align-items: flex-start / flex-end / center / ba…

类实现接口,并且对象转型引用,接口引用实现类,抽象类实现接口且被子类继承返回抽象类的值给接口对象转型父类引用子类

类实现接口,并且对象转型引用 目录接口:最最特殊的抽象类。声明行为当多个类有共同的属性和方法用抽象类当符合什么是什么?用继承;继承抽行类当描述能干嘛?用接口接口的方法都是抽象方法的声明接口和抽象类的区别以人的…

集成springSecurity遇到的跨域问题

引言 该项目主要使用技术:sprinboot、springSecurity、vue,其它的技术就不介绍了 其中springSecurity是我参考网上的案例去进行的集成,虽然集成成功了,但是还不是太懂。 下面就开始介绍一下我遇到的问题 问题重现 由于我项目后端集成了s…

[附源码]Python计算机毕业设计Django自行车租赁管理系统

项目运行 环境配置: Pychram社区版 python3.7.7 Mysql5.7 HBuilderXlist pipNavicat11Djangonodejs。 项目技术: django python Vue 等等组成,B/S模式 pychram管理等等。 环境需要 1.运行环境:最好是python3.7.7,…

【LSTM时序预测】基于LSTM实现时间序列神经网络预测附MATLAB代码

✅作者简介:热爱科研的Matlab仿真开发者,修心和技术同步精进,matlab项目合作可私信。 🍎个人主页:Matlab科研工作室 🍊个人信条:格物致知。 更多Matlab仿真内容点击👇 智能优化算法 …

行话|入局「软件定义汽车」,你真的准备好了吗?

什么是行话? 「行话」,是极狐 GitLab 推出的全新内容系列,探讨 Git 与 DevOps 在不同行业的实践场景与解决方案,希望能够为不同行业的软件开发者带来一些全新的思考和输入。 说行业,讲行话。 这一期,我们…

MMPose 实践笔记

1. 配置环境 参考:https://mmpose.readthedocs.io/zh_CN/latest/install.html 第 1 步 使用 MIM 安装 MMCV pip install -U openmim -i https://pypi.tuna.tsinghua.edu.cn/simple mim install mmcv-full第 2 步 安装 MMPose 我选择 从源码安装 git clone http…

Vector-常用CAN工具 - CANoe入门到精通_00

今天在梳理的时候突然发现写的CANoe工具入门到精通系列缺少了CANoe安装,实际对于CANoe的安装并不难,在“Vector-常用CAN工具 - CANoe入门到精通_01”中我有提过我们常说的CANoe主要由VN1640或者VN1640以及CANpiggy等硬件加上CANoe软件组成了我们工作中常…

Python3,9行批量提取PDF文件的指定内容,这种操作,保证人见人爱....

批量提取PDF文件指定内容1、引言2、代码实战2.1 介绍2.2 安装2.3 实例3、总结1、引言 小屌丝:鱼哥, 你有没有什么办法,提取PDF文档的内容。 小鱼:这个还问我?? 小屌丝:哎呀,这个不是…

leetcode题17电话号码的字母组合-java题解-回溯篇

说明:问题描述来源leetcode: 一、问题描述: 17. 电话号码的字母组合 难度中等2219 给定一个仅包含数字 2-9 的字符串,返回所有它能表示的字母组合。答案可以按 任意顺序 返回。 给出数字到字母的映射如下(与电话按键相同)。注…

【踩坑专栏】关于实现异步多线程的一些踩坑

在实现基于redis的分布式锁的时候,有一项功能,就是通过开启异步线程,对还没有unlock的key进行定时刷新,延长时间。 初始版本是New一个线程start。我们知道New一个线程,用了没多久又抛弃,这种方法非常消耗资…

【浅学Java】SpringBoot 日志文件

SpringBoot 日志文件1. 认识日志文件1.1. 日志文件有什么用?1.2 日志文件的格式2. 自定义日志文件的打印3. 日志的持久化3.0 什么时日志持久化3.1 设置日志名称3.2 设置日志目录3.3 持久化日志的特点4. 日志的级别5. 设置“日志级别”来筛选日志6. 简化日志打印——…

量子计算(十二):量子线路与测量操作

文章目录 量子线路与测量操作​​​​​​​ 量子线路与测量操作​​​​​​​ 量子线路是由代表量子比特演化的路线和作用在量子比特上的量子逻辑门组成的。量子线路产生的效果,等同于每一个量子逻辑门依次作用在量子比特上。在真实的量子计算机上,最…

HTML CSS游戏官网网页模板 仿绝地求生吃鸡游戏网站 大学生游戏介绍网站毕业设计 DW游戏主题网页模板下载

🎉精彩专栏推荐👇🏻👇🏻👇🏻 ✍️ 作者简介: 一个热爱把逻辑思维转变为代码的技术博主 💂 作者主页: 【主页——🚀获取更多优质源码】 🎓 web前端期末大作业…

[附源码]Python计算机毕业设计Django影院管理系统

项目运行 环境配置: Pychram社区版 python3.7.7 Mysql5.7 HBuilderXlist pipNavicat11Djangonodejs。 项目技术: django python Vue 等等组成,B/S模式 pychram管理等等。 环境需要 1.运行环境:最好是python3.7.7,…

使用yum info查看软件包信息与常用软件包

记录:357 场景:在CentOS 7.9操作系统上,使用yum info查看软件包信息,包括软件包名称、适用架构、版本号、发行版、软件大小、仓库名称、概要、URL、许可证、描述。 版本: 操作系统:CentOS 7.9 1.iptabl…

【现代机器人学】学习笔记三:前向运动学(Forward Kinematics)

这节的内容比较简单,主要配合习题来看。 在掌握方法以后,对常规的有许多移动副或转动副结构组成的机械臂,计算正向运动学则非常简单。 齐次变换法: 这种方法的特点是,只研究当前关节和上一个关节的旋转平移&#xf…

供应商关系管理与企业内容管理 (ECM) 相结合,帮助解决采购存在的五个关键挑战

供应商关系管理与企业内容管理 (ECM) 相结合,帮助解决采购存在的五个关键挑战 采购过程包括将制造需求转化为供应商需求、如何管理供应商关系、以及生产产品所需的商品和服务的订购。 领先的制造、制药、食品和自然资源组织正在意识到&#…

【性能优化】pc端与移动端图片性能优化

目录 优化方向 优化方式 1.域名收敛 2.使用CDN节点 3.设置缓存 4.图片懒加载 5.用户图片上传限制 6.使用OSS服务压缩 7.使用OSS缩放 8.合成雪碧图 9.使用svg图片 在前端项目中图片的性能优化也有不少可以提升的地方,那么有哪些性能优化的点呢&#xff1f…