Redis第四讲——Redis的数据库结构、删除策略及淘汰策略

news2024/11/26 18:39:29

一、redis中的数据库

  • redis服务器将所有数据库都保存在服务器状态redis.h/redisServer结构的db数组中。
  • db数组的每项都是一个redis.h/redisDb结构,而每个redisDb结构就代表一个数据库。
  • 在初始化服务器时,程序会根据服务器状态的dbnum属性来决定应该创建多少个数据库。
struct redisServer {
    // ...
    // 一个数组,保存着服务器中的所有数据库
    redisDb *db;
    // ...
    // 服务器的数据库数量
    int dbnum;
    // ...
};

dbnum属性的值是由redis.conf配置文件中的databases来决定的,默认为16个。

二、数据库的切换(select命令)

我们先用redis可视化工具连上我们本地的redis,如图:

默认情况下,Redis客户端的目标数据库为0号数据库,但可以用select命令来切库:  

在服务器内部,客户端状态redisClient结构的db属性记录了客户端当前的目标数据库,这个属性是一个指向redisDb结构的指针:

typedef struct redisClient {
// ...
// 记录客户端当前正在使用的数据库
redisDb *db;
// ...
} redisClient;

简单地说就是:通过修改redisClient.db指针,让它指向服务器中的不同数据库,就可以实现切换数据库的功能——这就是select命令的实现原理。

三、数据库键空间(key space)

redis是一个键值对(key-value)的数据库,每个数据库都由一个redis.h/redisDb结构表示,而redisDb结构的dict字典则保存了数据库中所有键值对,我们通常称之为键空间(key space

typedef struct redisDb {
    //数据库键空间,保存数据库中所有键值对
    dict *dict;                 
    dict *expires;    //过期字典,保存键的过期时间(4.2会提到)          
    dict *blocking_keys;        
    dict *ready_keys;          
    dict *watched_keys;         
    int id;                    
    long long avg_ttl;      
} redisDb;

键空间的每个键(key)都是字符串对象,而值(value)则可以是字符串、列表、哈希、集合等对象中的任意一种。

举个例子:

 执行上述命令后,数据库的键空间将会是下图的样子:

四、过期键

有时候我们希望给某些键一个过期时间,即希望它存活一段时间就失效,redis同样也给我们提供了这样的机制。

4.1 设置过期时间

4.1.1 expire和pexpire

expire用于设定某个键的过期时间,单位是秒,格式如下:

expire [key] [time]

127.0.0.1:6379> set hello world
OK
127.0.0.1:6379> get hello
"world"
127.0.0.1:6379> expire hello 10
(integer) 1
127.0.0.1:6379> get hello
(nil)

可以看到,10秒后redis删除了hello键,与之对应的还有一个pexpire命令,它的time时间单位为毫秒,即[pexpire hello 5]经过5毫秒后删除hello键。

4.1.2 expireat和pexpireat

expireat用于设定某个键在某个具体Unix时间戳过期,单位为秒,基本格式如下:

expireat [key] [time]

127.0.0.1:6379> set hello world
OK
127.0.0.1:6379> time
1) "1704285269"  //当前Unix时间戳
2) "434279"
127.0.0.1:6379> expireat hello 1704285289  //时间戳到1704285289时删除
(integer) 1 
127.0.0.1:6379> get hello
(nil)

过期键会在我们指定的Unix时间戳删除,当然它也有一个对应毫秒单位的命令——pexpireat

ps:当然也可以用setex,在设置一个字符串键的同时设置过期时间,但他仅限于string数据类型,这里就不介绍了。

4.1.3 ttl、pttl和persist

ttlpttl两个命令用于查看过期键还剩余多少时间。

127.0.0.1:6379> set hello world
OK
127.0.0.1:6379> expire hello 20
(integer) 1
127.0.0.1:6379> ttl hello
(integer) 17
127.0.0.1:6379> pttl hello
(integer) 10317 //毫秒单位,约为10.3秒

persist用于移除某个键的过期时间,使其永久有效:

127.0.0.1:6379> set hello world
OK
127.0.0.1:6379> expire hello 100
(integer) 1
127.0.0.1:6379> ttl hello
(integer) 96
127.0.0.1:6379> persist hello //移除hello键过期时间
(integer) 1 
127.0.0.1:6379> ttl hello
(integer) -1  //-1表示永久有效

4.2 保存过期时间

redisDb结构的expires指针保存了数据库中所有键的过期时间,我们称之为过期字典:

  • 过期字典的键是一个指针,这个指针指向键空间中的某个键对象。
  • 过期字典的值是一个longlong类型的整数,这个整数保存了键所指向的数据库键的过期时间——一个毫秒精度的UNIX时间戳

我们给person、abc键设置过期时间:

127.0.0.1:6379> pexpireat person 1735660800000 //2025年1月1日 00:00:00
(integer) 1
127.0.0.1:6379> pexpireat abc 1735664400000  //2025年1月1日 01:00:00
(integer) 1
127.0.0.1:6379> pttl person
(integer) 31374276693
127.0.0.1:6379> pttl abc
(integer) 31377871933

那么此时对应的键空间如下图:

 

redis判断键是否过期的大致步骤如下:

  • 检查键是否存在过期字典,如果存在则取到过期时间。
  • 判断当前UNIX时间戳是否大于键的过期时间,如果是,那么此键就过期,反之则未过期。

五、删除策略(避免内存泄漏)

我们每设置一个键的过期时间,redis就会在过期字典中保存一份。当键过期后,如果没有触发删除策略的话,过期后的数据依然会保存在内存中,即便已经过期,我们还是能够获取到这个键的数据。那么它们如何被删除呢,有三种策略,下面我们介绍下。

5.1 定时删除

  • 定时删除:在设置键的过期时间同时,创建一个定时器(timer),到了过期时间,立即执行对建的删除操作。

很显然,这是一种时间换空间的做法:

  • 优点:对内存友好,通过定时器可以保证过期的建尽可能快的被删除,从而释放内存。

  • 缺点:

    • 对CPU很不友好,在过期键比较多的情况下,删除操作会占用一部分CPU时间,在内存不紧张但CPU紧张的情况下,将CPU时间用在删除和当前任务无关的过期键上,无疑会对服务器的响应时间和吞吐量造成影响。

    • 除此之外,创建一个定时器需要用到redis服务器中的时间事件,而当前时间事件的实现方式——无序链表,查找一个事件的时间复杂度位O(N)——并不能高效地处理大量时间事件。

5.2 惰性删除

  • 不会主动去删除过期的键,而是在你要获取某个键时,会先检查一下这个键是否过期,如果没过期就返回给你,过期就会删除这个键。

很显然,这是一种空间换时间的做法:

  • 优点:对CPU友好,程序只会在获取键的时候进行过期检查,并不会在删除其它无关的过期键上花费任何CPU时间。

  • 缺点:对内存不友好,如果有非常多的过期键,并且这些键不会被访问到,那么它们将会永远不会被删除(除非flushdb),这可能会导致内存泄漏的风险。

5.3 定期删除

  • 每隔一段时间,程序就对数据库进行一次检查,删除里面的过期键。

定期删除则是对定时和惰性删除的一种折中方案:

  • 优点:

    • 定期删除策略每隔一段时间执行一次删除过期键的操作,并会限制删除操作执行的时长和频率来减少对CPU时间的影响。

    • 通过定期删除,可以有效地减少了因为过期键带来的内存浪费。

  • 缺点:

    • 如果删除操作执行太频繁或时间太长,定期删除则会退化为定时删除。

    • 如果删除操作执行的太少,又会退化为惰性删除。

所以,定期删除虽然是一个这种方案,但执行时长和频率难以把握。

5.4 redis中的删除策略

前面提到了三种策略,而redis采用的则是惰性删除+定期删除两种策略,那么它俩之间是如何配合的呢,我们一起来看看。

5.4.1 惰性删除

惰性删除策略由db.c/expireIfNeeded函数实现,所有读写数据库的redis命令在执行之前都会调用该函数对输入键进行检查,大致流程也很简单:

  • 对所有读写命令进行检查(调用expireIfNeeded函数)。

  • 判断键是否过期,如果过期则删除键,没过期就不做任何操作。

ps:甭管键过没过期都会执行实际的命令流程,比如get命令,如果键过期则会被删除,返回结果为null,如果没过期就返回实际的值。

5.4.2 定期删除

定期删除由redis.c/activeExpireCycle函数实现,redis默认每隔100ms就随机抽取部分设置了过期时间的key,检查这些key是否过期,如果过期就删除。

100ms的执行周期是默认的,可以在redis.conf文件中更改:

它的执行频率由hz参数值指定,默认是10,也就是每一秒执行10次。

注释翻译:

Redis调用内部函数执行许多后台任务,例如关闭超时的客户端连接,清除从未被请求的过期键等。 并非所有任务的执行频率都相同,但Redis会根据指定的“hz”值检查要执行的任务。 “hz”被设置为10。提高该值将在Redis空闲时使用更多的CPU,但同时在有许多键同时过期且需要更高的精度的情况下,会使Redis的响应更快。 范围介于1和500之间。然而,通常不建议超过100的值,而应该默认使用10,并将其升至100的值仅适用于需要非常低延迟的环境。大多数用户不需要设置高于10的“hz”值。

5.0版本之前,hz参数一旦设定就会被固定,但如果链接数比较多的情况下,10的默认值可能就不能够满足这种情况,就需要手动去更改hz的值,这样就很不方便。

redis 5.0之后,有了dynamic-hz参数,默认就是打开的,当连接数很多时,就会自动加倍hz,以便处理更多的链接:

注释翻译:

通常情况下,拥有与连接的客户端数量成比例的 Hz 值是很有用的。例如,这对于在每次后台任务调用期间避免处理太多客户端以避免延迟峰值是很有用的。 由于默认情况下,HZ 值被保守地设置为 10,Redis 提供并默认启用了使用自适应 Hz 值的能力,该值在存在许多连接的情况下会临时增加。 启用动态 Hz 时,实际配置的 Hz 值将作为基线使用,但在连接更多客户端时,将根据需要使用配置的 Hz 值的倍数。这样,空闲实例的 CPU 时间将很少,而繁忙实例将更加响应。

那么它到底是这么删的呢,源码如下

for (j = 0; j < dbs_per_call; j++) {
 int expired;
 redisDb *db = server.db+(current_db % server.dbnum);
 current_db++;
 /* 超过25%的key已过期,则继续. */
 do {
  unsigned long num, slots;
  long long now, ttl_sum;
  int ttl_samples;
 
  /* 如果该db没有设置过期key,则继续看下个db*/
  if ((num = dictSize(db->expires)) == 0) {
   db->avg_ttl = 0;
   break;
  }
  slots = dictSlots(db->expires);
  now = mstime();
 
  /*但少于1%时,需要调整字典大小*/
  if (num && slots > DICT_HT_INITIAL_SIZE &&
   (num*100/slots < 1)) break;
 
  expired = 0;
  ttl_sum = 0;
  ttl_samples = 0;
 
  if (num > ACTIVE_EXPIRE_CYCLE_LOOKUPS_PER_LOOP)
   num = ACTIVE_EXPIRE_CYCLE_LOOKUPS_PER_LOOP;// 20
 
  while (num--) {
   dictEntry *de;
   long long ttl;
 
   if ((de = dictGetRandomKey(db->expires)) == NULL) break;
   ttl = dictGetSignedIntegerVal(de)-now;
   if (activeExpireCycleTryExpire(db,de,now)) expired++;
   if (ttl > 0) {
    /* We want the average TTL of keys yet not expired. */
    ttl_sum += ttl;
    ttl_samples++;
   }
  }
 
  /* Update the average TTL stats for this database. */
  if (ttl_samples) {
   long long avg_ttl = ttl_sum/ttl_samples;
 
   /样本获取移动平均值 */
   if (db->avg_ttl == 0) db->avg_ttl = avg_ttl;
   db->avg_ttl = (db->avg_ttl/50)*49 + (avg_ttl/50);
  }
  iteration++;
  if ((iteration & 0xf) == 0) { /* 每迭代16次检查一次 */
   long long elapsed = ustime()-start;
 
   latencyAddSampleIfNeeded("expire-cycle",elapsed/1000);
   if (elapsed > timelimit) timelimit_exit = 1;
  }
 /* 超过时间限制则退出*/
  if (timelimit_exit) return;
  /* 在当前db中,如果少于25%的key过期,则停止继续删除过期key */
 } while (expired > ACTIVE_EXPIRE_CYCLE_LOOKUPS_PER_LOOP/4);
}

大致的逻辑如下:

  • 依次遍历每个db(默认是16个),针对每个db随机选择20个设置了生存时间的(ACTIVE_EXPIRE_CYCLE_LOOKUPS_PER_LOOP)键,并对过期的键进行删除。
  • 如果被删除的key超过了25%,再次随机筛选出20个设置了生存时间的key....
  • 如果被删除的key不超过25%,这次定期删除结束。

六、内存淘汰策略(避免内存溢出)

本来没想介绍这节的,但发现删除策略和淘汰策略关系还挺密切的,索性一起介绍了吧。

我们现在想一个问题,定期+惰性可以保证过期的key一定会被删掉,但是只能保证最终一定会被删除,要是定期删除遗漏了大量的过期键,而且很长一段时间都不会访问这些键,那么久而久之redis内存可能会被耗尽,由于可能会存在这样的问题,所以redis又引入了“内存淘汰机制”来解决:

当Redis的内存空间不足,还需要再存储数据时,就会触发淘汰策略,默认策略就是抛出异常…………

  • volatile-lru -> Evict using approximated LRU among the keys with an expire set.

        在设置了生存时间的key中,采用最近最少使用的策略删除key

  • allkeys-lru -> Evict any key using approximated LRU.

        在全部的key中,采用最近最少使用的策略删除key

  • volatile-lfu -> Evict using approximated LFU among the keys with an expire set.

        在设置了生存时间的key中,采用最近最少频次使用的策略删除key

  • allkeys-lfu -> Evict any key using approximated LFU.

        在全部的key中,采用最近最少频次使用的策略删除key

  • volatile-random -> Remove a random key among the ones with an expire set.

        闹着玩,随机删……

  • allkeys-random -> Remove a random key, any key.

        闹着玩,随机删……

  • volatile-ttl -> Remove the key with the nearest expire time (minor TTL)

        在设置了生存时间的key中,删除剩余生存时间最少的key

  • noeviction(默认策略) -> Don't evict anything, just return an error on write operations.

        抛出异常!

那么如何选择,以下是腾讯针对redis淘汰策略给出的建议:

  • 当redis作为缓存使用的时候,推荐使用allkeys-lru。该策略会将最近最少使用的key淘汰。默认情况下,使用频率最低则后期命中的概率也最低,所以将其淘汰。
  • 当redis作为半缓存半持久化使用时,可以用volatile-lru。因为redis本身不建议保存持久化数据,所以只做备选方案。

 End:希望对大家有所帮助,如果有纰漏或者更好的想法,请您一定不要吝啬你的赐教🙋。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1357483.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

python+selenium爬虫笔记

本文只是做例子&#xff0c;具体网站路径麻烦你们换下&#xff0c;还有xpath路径也换下 一、安装所需要的组件&#xff08;此处采用谷歌&#xff09; 1、安装驱动 查看你的浏览器版本&#xff0c;去安装对应的版本 下载驱动 下载驱动路径 之前版本的 输入这个路径下载下来解压…

CTF-PWN-栈溢出-高级ROP-【SROP】

文章目录 linux信息处理2017 360春秋杯 smallest检查源码思路第一次要执行ret时的栈执行write函数时修改rsp到泄露的栈地址上去 输入/bin/sh并sigreturn调用系统调用回忆exp注意一个离离原上谱的地方 参考链接 SROP(Sigreturn Oriented Programming) 于 2014 年被 Vrije Univer…

系列十、Spring Cloud Gateway

一、Spring Cloud Gateway 1.1、概述 Spring Cloud全家桶中有个很重要的组件就是网关&#xff0c;在1.x版本中采用的是Zuul网关&#xff0c;但是在2.x版本中&#xff0c;由于Zuul的升级一直跳票&#xff0c;Spring Cloud最后自己研发了一个网关替代Zuul&#xff0c;即&#xf…

优雅实现微信小程序动态tabBar,根据不同用户角色显示不同底部导航——更新版(支持自由组合总数超过5个tabBar菜单)

背景 在开发小程序过程中&#xff0c;有个需求是&#xff0c;小程序底部的tabBar需要根据不同用户角色显示不同底部导航。此时就需要用到自定义底部导航 custom-tab-bar。 上次发文是组合显示4个底部tabBar导航&#xff0c;很多小伙伴评论说组合超过5个怎么办。他们的需求总数…

Android中的Intent

一.显式Intent 显示Intent是明确目标Activity的类名 1. 通过Intent(Context packageContext, Class<?> cls)构造方法 2.通过Intent的setComponent()方法 3.通过Intent的setClass/setClassName方法 通过Intent(Context packageContext, Class<?> cls)构造方法 通…

JVM之对象创建

对象创建的流程 1.类加载检查 虚拟机遇到一条new指令时&#xff0c;首先将去检查这个指令的参数是否能在常量池中定位到一个类的符号引用&#xff0c;并且检查这个符号引用代表的类是否已被加载、解析和初始化过。如果没有&#xff0c;那必须先执行相应的类加载过程。new指令对…

Callback Hook

一、Callback Hook 函数名&#xff1a;useCallback 用于得到一个固定引用值的函数&#xff0c;通常用它进行性能优化。 useCallback: 该函数只需要传入两个参数&#xff1a;一个回调函数和一个依赖数组即可。 1.函数&#xff0c;useCallback会固定该函数的引用&#xff0c;…

【Rust日报】Piccolo - 用纯Rust实现的无栈Lua虚拟机

Piccolo - 用纯Rust实现的无栈Lua虚拟机 Piccolo&#xff0c;原名luster&#xff0c;在经过数年的中断后&#xff0c;于2023年4月悄然恢复了开发。曾经开发过 rlua 的 kyren&#xff0c;在底层 gc-arena crate 取得突破后&#xff0c;回到了 piccolo 项目。这两个项目现在已经&…

Python:界面开发,wx入门篇

以下内容为本人的学习笔记&#xff0c;如需要转载&#xff0c;请声明原文链接 微信公众号「ENG八戒」https://mp.weixin.qq.com/s/3Yb_YAKiMte_f5HanetXiA 本文大概 3617 个字&#xff0c;阅读需花 10 分钟 内容不多&#xff0c;但也花了一些精力 如要交流&#xff0c;欢迎评…

极速 JavaScript 打包器:esbuild

文章目录 引言什么是esbuild&#xff1f;esbuild的特点esbuild如何实现如此出色的性能&#xff1f;esbuild缺点基本配置入口文件输出文件模块格式targetplatformexternalbanner和footer 高级配置插件系统自定义插件压缩代码调试代码 结论&#x1f636; 写在结尾 引言 esbuild是…

leetcode:724. 寻找数组的中心下标

一、题目 二、函数原型 int pivotIndex(int* nums, int numsSize) 三、思路 首先要理解正确中心下标&#xff0c;中心下标左侧元素之和等于右侧元素之和&#xff0c;比较时是不包含中心下标所指元素的。 先将数组和求出来记为sum&#xff0c;再遍历数组&#xff0c;遍历到…

快速批量运行命令

Ansible 是 redhat 提供的自动化运维工具&#xff0c;它是 Python编写&#xff0c;可以通过 pip 安装。 pip install ansible 它通过任务(task)、角色(role)、剧本(playbook) 组织工作项目&#xff0c;适用于批量化系统配置、软件部署等需要复杂操作的工作。 但对于批量运行命…

pytorch集智-1安装与简单使用

1 安装 1.1 简介 pytorch可用gpu加速&#xff0c;也可以不加速。gpu加速是通过cuda来实现&#xff0c;cuda是nvidia推出的一款运算平台&#xff0c;它可以利用gpu提升运算性能。 所以如果要装带加速的pytorch&#xff0c;需要先装cuda&#xff0c;再装pytorch&#xff0c;如…

【重点】【BFS】542.01矩阵

题目 法1&#xff1a;经典BFS 下图中就展示了我们方法&#xff1a; class Solution {public int[][] updateMatrix(int[][] mat) {int m mat.length, n mat[0].length;int[][] dist new int[m][n];boolean[][] used new boolean[m][n];Queue<int[]> queue new Li…

excel中解决多行文本自动调整行高后打印预览还是显示不全情况

注意&#xff1a;此方法对于多行合并后单元格行高调整不适用&#xff0c;需要手动调整&#xff0c;如大家有简便方法&#xff0c;欢迎评论。 一、调整表格为自动调整行高 1&#xff09;点击此处全选表格 2&#xff09;在第一行序号单元格的下端&#xff0c;鼠标成黑十字时&am…

【React系列】父子组件通信—props属性传值

本文来自#React系列教程&#xff1a;https://mp.weixin.qq.com/mp/appmsgalbum?__bizMzg5MDAzNzkwNA&actiongetalbum&album_id1566025152667107329) 一. 认识组件的嵌套 组件之间存在嵌套关系&#xff1a; 在之前的案例中&#xff0c;我们只是创建了一个组件App&…

机器人制作开源方案 | 清洁机器人

作者&#xff1a;胡志宇、白永康、颉志国、刘昭迅、王维浩 单位&#xff1a;北京石油化工学院 指导老师&#xff1a;陈亚、王殿军 1. 设计方案论证 1.1 清洁机器人方案选择 目前&#xff0c;市场上清洁机器人比比皆是&#xff0c;各大品牌之间的竞争也相当激烈&#xff0c;…

docker kafka go demo

配置 创建网桥 docker network create app-tier --driver bridge拉取并启动镜像 docker run -d --name kafka-server --hostname kafka-server \--network app-tier \-p 9092:9092 \-e ALLOW_PLAINTEXT_LISTENERyes \-e KAFKA_CFG_ADVERTISED_LISTENERSPLAINTEXT://192.168.…

链表--206. 反转链表/easy

206. 反转链表 1、题目2、题目分析3、解题步骤4、复杂度最优解代码示例5、抽象与扩展 1、题目 给你单链表的头节点 head &#xff0c;请你反转链表&#xff0c;并返回反转后的链表。 示例 1&#xff1a; 输入&#xff1a;head [1,2,3,4,5] 输出&#xff1a;[5,4,3,2,1]示例 2…

【大数据进阶第二阶段之Hadoop学习笔记】Hadoop 运行环境搭建

【大数据进阶第二阶段之Hadoop学习笔记】Hadoop 概述-CSDN博客 【大数据进阶第二阶段之Hadoop学习笔记】Hadoop 运行环境搭建-CSDN博客 【大数据进阶第二阶段之Hadoop学习笔记】Hadoop 运行模式-CSDN博客 1、模板虚拟机环境准备 1.1、 hadoop100 虚拟机配置要求如下 &…