应对Redis缓存污染问题,你应该知道这些内容

news2025/1/21 18:45:25

前言

我们在使用Redis做为缓存时,能加速我们对于热点数据的查询。但是如果缓存中有大量的数据不再热门了,从而占据着大量的内存空间,那么我们的Redis性能就会收到很大影响。该如何解决这个问题呢?本文给你答案。

什么是缓存污染

就是在redis的数据,如果被访问的次数极少,在缓存中起到的作用就不大,若不处理的话,还会占用缓存空间。这就是缓存污染。

当这些污染数据不多时,对缓存系统影响不大。但污染数据变得很多之后,缓存空间就堆积了大量无用数据。这个时候我们要再往缓存写数据,就得将这些数据淘汰掉。这个淘汰过程又会带来额外的开销,影响Redis的性能。

缓存污染解决方案

说到底,解决缓存污染的根本方式就是将这些访问极少的数据找出来删掉就行了。问题就在于如何筛选出污染数据。联想到Redis的八大缓存淘汰策略,我们来看看用哪种淘汰策略最合适。

淘汰策略策略释义
noeviction不会数据淘汰:缓存满了不再接收写请求,返回错误
volatile-random对设置了过期时间的数据随机删除
volatile-ttl根据过期时间的先后删除设置了过期时间的
volatile-lru使用LRU算法筛选设置了过期时间的数据然后删除
volatile-lfu(Redis 4.0 后)使用LFU算法筛选设置了过期时间的数据然后删除
allkeys-lru使用LRU算法对所有数据筛选后删除
allkeys-random随机对所有数据筛选后删除
allkeys-lfu(Redis4.0后)使用LFU算法对所有数据筛选后删除

先剔除掉几个策略:

  • noeviction策略:noeviction策略是不淘汰数据,因此不能作为缓存污染问题的策略。
  • volatile-random 和 allkeys-random策略:都是采用随机筛选数据淘汰,不会因为数据是否访问来筛选。因此若热门数据被随机选中删除了,后续访问会出现缓存缺失,并解决不了问题。因此也不适合。
  • volatile-ttl策略:筛选的是设置了过期时间的数据。但距离过期时间的长短,并不能体现出数据的访问情况。淘汰数据后也还是容易出现缓存缺失问题。所以也不适合。

这样一来,8大策略就被我们排除了4个策略,也就剩下了volatile-lru、allkeys-lru、volatile-lfu、allkeys-lfu四种策略,按照淘汰算法来看就剩lru策略和lfu策略了。下面分别分析下lru和lfu在缓存污染问题上是否适用。

LRU淘汰策略

首先我们看看LRU算法策略的定义就是:认为最近使用过的数据是有用的,淘汰的是那些最近没被使用的数据。

Redis根据LRU这个算法策略,在每个数据的 RedisObject结构体中设计了一个lru字段,这个字段会记录数据最近一次访问的时间戳。 当触发了数据淘汰的动作时,如果我们用的是volatile-lru或者allkeys-lru策略,Redis就会在候选的数据集合中筛选出lru字段最小的数据(也就是时间戳最小,被访问的时间最早)。

我们知道了Redis LRU是如何淘汰数据的,再来分析一下LRU是否在缓存污染问题上适用。

LRU策略只关注数据的访问时间,而缓存污染问题主要关注数据的访问频次。因此,在缓存污染问题上,LRU淘汰策略也不是最合适的。 用个图例来看看吧。

如上面图例,数据5写到缓存之后,一直没有被访问。经过3次数据淘汰之后,数据5依然还在缓存中,这就是缓存污染问题还没解决。因此,使用LRU策略,在这种缓存污染问题上效果不好。

在实际应用中,有些数据只是偶尔查询少数几次,后续就基本不查了。比如订单数据有很多,通常缓存中保留的是最近订单数据。我们排查某些订单问题时,有条去年的订单会取出来看看具体数据情况,查完解决问题后基本就不用了。如果用的是LRU策略,这条数据就可能在缓存中保留很长一段时间。

这样看来,LRU策略也不是很擅长解决缓存污染问题,最后再来看看LFU淘汰策略。

LFU淘汰策略

LFU淘汰策略,它是redis4.0之后才加入的淘汰策略。它的出现就是旨在解决LRU策略在数据访问频次的缺陷的。

LFU淘汰策略的定义就是筛选出最近时间最少使用的数据。 根据这段定义,我们大概就能知道LFU策略就适用于解决缓存污染问题了。那么我们来看看redis的LFU是如何设计的。

通过上文LRU的解释,我们都知道Redis数据的RedisObject 结构有一个lru字段。在LFU策略中,并没有在RedisObject 结构上新增类似lfu的字段,而是在lru字段上做了额外动作。lru字段大小为24bit,lfu的实现是这样的:

  • ldt值:lru字段前16位保存的是数据最近访问的时间戳;
  • counter值:lru字段后8位用来保存数据的访问次数。

通过对lfu字段的剖析,很容易分析得出:当使用LFU淘汰策略时,Redis在候选数据集中,会根据lru字段的counter值筛选最小的数据出来。如果存在多个counter值相同的数据,就再比较lru字段的ldt值,取出ldt值最小的数据出来淘汰。

LFU counter计数策略

还有个问题就是:8位的数值最大就到255,lru的counter值只能到255吗?那超过255的不就无法比较了?显然不是,Redis在记录数据counter值的时候,并不是每访问一次,就给counter+1。具体做法是这样的:

/* Logarithmically increment a counter. The greater is the current counter value
 * the less likely is that it gets really implemented. Saturate it at 255. */
uint8_t LFULogIncr(uint8_t counter) {
    if (counter == 255) return 255;
	// 随机生成一个0-1之间的浮点数r
    double r = (double)rand()/RAND_MAX;
	// 当前counter减去常量LFU_INIT_VAL(默认为5)
    double baseval = counter - LFU_INIT_VAL;
    if (baseval < 0) baseval = 0;
	// server.lfu_log_factor是配置项
    double p = 1.0/(baseval*server.lfu_log_factor+1);
	// 如果随机数r<p,counter+1
    if (r < p) counter++;
    return counter;
}
复制代码

由上面Redis LFU源码(源码位于redis目录下的/src/evict.c文件)可以得知数据被访问是counter的变化:

  • 生成一个0-1之间的随机浮点数r;
  • 用数据当前的counter - LFU_INIT_VAL得到值baseval(LFU_INIT_VAL默认为5);
  • 用上面得到的 baseval * 配置项lfu_log_factor + 1,然后取倒数,这样就得到了值p;
  • 最后比较p和随机数r,只有p>r时,counter才会加1。

通过源码分解,我们就能知道counter值不是简单的累加了,而是通过配置项 lfu_log_factor和随机数的对比来控制counter的累加的 我们可通过配置lfu_log_factor值来控制计数器counter的增长速度,lfu_log_factor设置的越大,counter增长速度越慢。

上图是Redis官方文档中lfu_log_factor取值为0、1、10、100时,数据被访问次数对应的counter值。比如lfu_log_factor设置为10时,访问次数达到1百万时,counter值才达到255。我们普通的应用,将lfu_log_factor设置为10就基本够用了。

我们有些业务场景,部分数据在一段时间内会被大量的访问,之后就几乎不访问了。如果只有上述策略,counter值会一直很大,从而在缓存中一直留着。

为了解决这个问题,Redis LFU除了访问次数counter的优化,LFU还有用配置项 lfu_decay_time 来控制访问次数的衰减,这就是衰减访问次数策略。

衰减访问次数策略

unsigned long LFUDecrAndReturn(robj *o) {
    unsigned long ldt = o->lru >> 8;
	// 获取当前的访问次数
    unsigned long counter = o->lru & 255;
    // 计算衰减因子
    unsigned long num_periods = server.lfu_decay_time ? LFUTimeElapsed(ldt) / server.lfu_decay_time : 0;
    if (num_periods)
	// 若衰减因子不等于0,且衰减因子 > 访问次数,则访问次数=0;否则访问次数置为 当前访问次数-衰减因子
        counter = (num_periods > counter) ? 0 : counter - num_periods;
    return counter;
}
复制代码

上图是Redis LFU衰减因子部分源码,简单来说就是用当前时间戳和最近一次访问的时间ldt的差值(差值要转换为分钟单位),然后这个差值 / lfu_decay_time就是衰减因子。 然后用这个衰减因子和当前计数counter比较,若衰减因子 > 访问次数,则访问次数=0;否则访问次数置为 当前访问次数-衰减因子。

lfu_decay_time默认值为1,举个例子来说,比如数据A上一次被访问在10分钟前,衰减因子就= 10 / 1 = 10。如果当前计数counter=11,然后经过衰减策略之后,计数counter就是11 - 9 = 2。

通过衰减访问次数的策略,就能更快的衰减掉那些短时间内高频访问后续少访问的数据了。 通过以上分析,解决缓存污染问题用LFU淘汰策略就比较适合了。

小结

本文总结了如何去解决redis缓存污染问题,通过分析Redis 8大淘汰策略对缓存污染问题的适用性,重点解析了Redis LRU淘汰策略和LFU淘汰策略,最后选择了LFU淘汰策略来解决缓存污染问题。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/26243.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

kafka开发环境搭建

1 kafka开发环境 1.1 安装Java环境 1.1.1 下载linux下的安装包 登陆网址https://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html 下载完成后&#xff0c;Linux默认下载位置在当前目录下的Download或下载文件夹下&#xff0c;通过命令cd ~/…

轻松学习string类常用接口(附模拟实现)

目录 String的常用接口说明(最常用的) string类对象的容量操作 string类对象的访问及遍历操作 string类对象的修改操作 string类非成员函数 深浅拷贝 简介&#xff1a;Cstring 是C中的字符串。 字符串对象是一种特殊类型的容器&#xff0c;专门设计来操作的字符序列。 不像…

MySQL 全文检索的实现

微信搜「古时的风筝」&#xff0c;还有更多技术干货 这有朋友聊到他们的系统中要接入全文检索&#xff0c;这让我想起了很久以前为一个很古老的项目添加搜索功能的事儿。 一提到全文检索&#xff0c;我们首先就会想到搜索引擎。也就是用一个词、一段文本搜索出匹配的内容。一般…

Vue3中的组合Api与响应函数

文章目录1. 组合Api介绍setup2. 响应函数2.1 ref2.2 reactive2.3 toRef和toRefs2.4 readonly2.5 customRef1. 组合Api介绍 组合Api其实时用于解决功能、数据和业务逻辑分散的问题&#xff0c;使项目更益于模块化开发以及后期维护。 vue2.x — optionsApi 配置式Api — react类…

STM32 定时器定时计算

STM32 定时器定时计算STM32 定时器频率例子公式referenceSTM32 定时器频率 定时时间 定时器频率 / 倍频 /装载周期 htim1.Init.Prescaler 72-1;htim1.Init.CounterMode TIM_COUNTERMODE_UP;htim1.Init.Period 1*1000*1000;tim 72x10^6 / (72-1)/ 110001000 1us 根据定时…

RAC/RAC One Node 修改私网/心跳网卡名

cDAS RAC/RAC One Node一般采用ib ip作为私网/心跳ip&#xff0c;有些现场可能会有修改心跳/私网网卡的需求&#xff0c;一般修改网卡也会伴随修改心跳/私网ip的需求。若心跳/私网有高可用&#xff0c;可以一个个修改。 场景1&#xff1a;心跳网卡有高可用 原心跳网卡名 原心…

Vue中 引入使用 localforage 改进本地离线存储(突破5M限制)

1. 简介 说到本地存储数据&#xff0c;首先想到的是 localStorage&#xff0c;应该很多小伙伴都用过&#xff0c;使用很简单。然而&#xff0c;localStorage 却有下面一些缺点&#xff1a; 存储容量限制&#xff0c;大部分浏览器应该最多5M。我就遇到过localStorage存储字符然…

H264码流中SPS PPS详解

1 SPS和PPS从何处而来&#xff1f; 2 SPS和PPS中的每个参数起什么作用&#xff1f; 3 如何解析SDP中包含的H.264的SPS和PPS串&#xff1f; 1 客户端抓包 在做客户端视频解码时&#xff0c;一般都会使用Wireshark抓包工具对接收的H264码流进行分析&#xff0c;如下所示&…

Transform+ASM插桩系列(3)——Transform+ASM的实战

回顾 在上一章讲到创建完buildSrc之后&#xff0c;实现了项目的plugin之后&#xff0c;就可以在plugin注册我们的Transform。这期文章将正式进入重头戏&#xff0c;今天的学习内容有【认识Transform】、【认识AMS】、【插桩实战】 前言 插桩的技巧中&#xff0c;我们要知道 …

Python实现LDA和KNN人脸识别模型(LinearDiscriminantAnalysis和KNeighborsClassifier算法)项目实战

说明&#xff1a;这是一个机器学习实战项目&#xff08;附带数据代码文档视频讲解&#xff09;&#xff0c;如需数据代码文档视频讲解可以直接到文章最后获取。 1.项目背景 人脸识别&#xff0c;是基于人的脸部特征信息进行身份识别的一种生物识别技术。用摄像机或摄像头采集含…

【2021-TITS】Deep Learning in Lane Marking Detection: A Survey

概述 回顾了针对路面标线的深度学习算法&#xff0c;主要分析了他们的网络架构及优化目标&#xff1b;此外还总结了现有车道标线相关的数据集&#xff0c;评价基准及常见的数据处理技术 PaperCode 总结 创新点&#xff1a; 1.总结深度学习网络架构、优化目标2.总结了相关现有…

使用Portman、Postman和Newman自动化API测试

几个月前我换了工作和公司&#xff0c;很喜欢这样的变化&#xff0c;但多少会有些不知所措。现在事情已经安排好了一些&#xff0c;我可以回来做一些我喜欢的事情。 现在正在工作的团队是一个新团队&#xff0c;我们正在努力弄清楚我们的流程&#xff0c;并试图尽可能地实现自…

编译原理实验一:源程序的预处理及词法分析程序的设计与实现(python)

实验目的 设计并实现一个包含预处理功能的词法分析程序&#xff0c;加深对编译中词法分析过程的理解。 实验要求 1、实现预处理功能 源程序中可能包含有对程序执行无意义的符号&#xff0c;要求将其剔除。 首先编制一个源程序的输入过程&#xff0c;从键盘、文件或文本框输…

[附源码]java毕业设计校园拓展活动管理系统

项目运行 环境配置&#xff1a; Jdk1.8 Tomcat7.0 Mysql HBuilderX&#xff08;Webstorm也行&#xff09; Eclispe&#xff08;IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持&#xff09;。 项目技术&#xff1a; SSM mybatis Maven Vue 等等组成&#xff0c;B/S模式 M…

论文阅读之Dynamic Routing Between Capsules(2017)

文章目录前言capsule network参考前言 capsule network 可以简单理解为将神经网络的标量计算&#xff0c;赋予了方向&#xff0c;变换成了向量进行计算。 标量只有大小之分。 向量不仅有大小&#xff0c;还有方向之分。 应该可以略微感受到这种思路的魔力了。 capsule 主要是…

IB历史备考,如何拿高分?

邻近期末考&#xff0c;大伙儿是不是十分焦虑不安呢&#xff1f;大家的老师经常发觉学生们本来知识要点都把握得挺不错的&#xff0c;但每到考試便是拿不上满意的考试成绩&#xff0c;让人十分郁闷&#xff01;因此应对那样的难点&#xff0c;大家的IB历史时间评委为大伙儿筹备…

行业分析| 智慧消防对讲

消防工程关系国计民生&#xff0c;关系到每个公民的人身和财产安全&#xff0c;在每个场所的建设中&#xff0c;消防工程建设是必不可少的一个板块&#xff0c;包括消防应急通道建设和应急设备建设两个方面。其中消防系统设备建设主要分为九大系统的建设&#xff1a;消防水系统…

VectorCAST测试工具环境搭建

**目的&#xff1a;**本文提供VectorCAST使用的实际操作方法&#xff0c;以便项目可以很好的使用VectorCAST工具。 适用范围&#xff1a;VectorCAST是一个专门针对嵌入式软件的C/C代码进行单元测试的工具&#xff0c;它可以自动生成测试用例、评估测试结果并生成测试报告。 **工…

十年来高薪专业变成了它——信息安全

“什么专业好就业&#xff1f;” “什么专业以后赚的钱多&#xff1f;” 确实&#xff0c;专业对应的行业薪资各有不同&#xff0c;选对了专业赢在起跑线也不是没有可能&#xff01; 麦可思机构分析了近十年大学生就业数据情况&#xff0c;发现从2011年到2020年的大学毕业生高…

Windows简单安装redis

1.去git下载 或者去搜点资源&#xff0c;windows下载是压缩包&#xff0c;找个目录解压进去。 Github下载地址&#xff1a;https://github.com/MicrosoftArchive/redis/releases 2.打开cmd 尝试启动 比如我放在d盘soft下面&#xff0c;windows你直接打开cmd&#xff0c;输入d…