Redis的内存淘汰策略分析

news2026/4/1 10:53:04

概念

LRU 是按访问时间排序，发生淘汰的时候，把访问时间最久的淘汰掉。
LFU 是按频次排序，一个数据被访问过，把它的频次 + 1，发生淘汰的时候，把频次低的淘汰掉。

几种LRU策略

以下集中LRU测率网上有很多，我自己结合项目加以整理。也可以选择跳过。

1. 普通LRU

在这里插入图片描述

一般使用双向链表+map实现，新数据加入链表表头
每当缓存命中时，将数据移动到表头
链表长度超过设定值，将尾部数据淘汰
缺点：当热点数据较多时，随后来了一次偶发性的操作，操作的数据较多，容易将热点数据淘汰出去。

2. LRU-K

考虑到传统LRU的缺点，改进措施是记录数据的被访问次数。维护两个LRU队列，一个数据访问次数队列，一个缓存队列。当访问达到预设值K时，加入到缓存队列中。对于偶然性的访问非热点数据时，命中次数不够，不会加入到缓存队列中，则不会挤出热点数据。
在这里插入图片描述

命中数据后，加入访问次数队列中，被访问次数+1，同普通LRU的逻辑。
淘汰数据。
当访问次数超过预设值，从此队列中移除，加入到缓存队列中，按照访问时间排序。
缓存队列中的数据再次被命中，按照访问时间顺序排序。
淘汰数据。
缺点：需要谨慎考虑K值的设定，设定过大会导致数据很难被淘汰。整体内存消耗也偏高。同时也要按照访问时间重排序。

3. 2Queue

优化重排序问题。
在这里插入图片描述

数据被访问后，加入到FIFO队列中。
FIFO按照访问时间进行淘汰。
当数据再次被访问时，则移到LRU队列头部。
数据再次被访问，移动到头部。
LRU队列淘汰。

4. Multi Queue

同2Queue，增加了多个FIFO队列，按照预设条件，从左到右逐级提升等级。随着数据被淘汰，从右向左逐级降级。
在这里插入图片描述

Redis的LRU/LFU策略

内存淘汰策略配置

maxmemory：指定限制内存大小。默认=0，表示无限制。
maxmemory_policy: 指定的淘汰策略，目前有以下几种：
- noeviction：默认值，不处理。
- allkeys-lru：对所有的key都采取LRU淘汰策略。
- volatile-lru：仅对设置了过期时间的key采取LRU淘汰。
- allkeys-random: 随机回收key。
- Volatile-random: 随机回收设置了过期时间的key。
- volatile-ttl：仅淘汰设置了过期时间的key，并淘汰生存时间更小的key。
- Volatile-lfu: 对设置了过期时间的key采取LFU策略。
- Allkeys-lfu: 对全部key采取LFU策略
maxmemory_samples：随机采样精度。官方表示配10更接近真实的LRU策略。

2. Redis的LRU策略

给每个key记录一个lru time。
每次访问key的时候，更新key的lru time。
按照策略配置。在一定范围内，找访问时间最早的key，将其淘汰。
具体看下面的源码分析。

3. Redis的LRU策略的缺陷

//从左到右是时间轴，每个波浪线代表一个时间单位
//竖线是当前时间点

~~~~~A~~~~~A~~~~~A~~~~A~~~~~A~~~~~A~~|
~~B~~B~~B~~B~~B~~B~~B~~B~~B~~B~~B~~B~|
~~~~~~~~~~C~~~~~~~~~C~~~~~~~~~C~~~~~~|
~~~~~D~~~~~~~~~~D~~~~~~~~~D~~~~~~~~~D|

//可以看到，如果4个key中非要淘汰一个，肉眼看出来一定是淘汰D，因为它访问的次数最少。但是由于
//当前时间点，D再次被访问，它的LRU时间又被更新了，导致D不会被淘汰，范围淘汰了C。
//这种情况就不合理，因此redis4.0版本后引入了LFU策略。

4. Redis的LFU策略

struct redisObject {
    unsigned type:4;
    unsigned encoding:4;
    //对于lru而言，这里记录了lru time
    //对于lfu而言，高24位记录LRU time，低8位记录计数器的值（最大可表示255）
    unsigned lru:LRU_BITS; 
    int refcount;
    void *ptr;
};

给每个key记录一个计数count。
由于只有8位长度，最多只能表示255，因此采用了一个因子控制count的增长速度。
新的key加入进来，会设置为预设值（LFU_INIT_VAL），以免为0直接被淘汰。
每当这个key被访问时，按照增长逻辑，增长count值。
每当这个key被放入到淘汰候选池内，则会降低count值。

5. 源码分析

当执行命令，命中数据时，更新数据：

//查找缓存数据时，最终都会调用此函数
//如： lookupKeyRead(), lookupKeyWrite() 
robj *lookupKey(redisDb *db, robj *key, int flags) {
    dictEntry *de = dictFind(db->dict,key->ptr);
    ...
    robj *val = dictGetVal(de);
     
    if (val) { 
        if (不能在执行子任务的时候 && !(flags & LOOKUP_NOTOUCH)){
            if (server.maxmemory_policy & MAXMEMORY_FLAG_LFU) {
            //如果是LFU策略，这里就增长LFU计数
                updateLFU(val);
            } else {
            //如果是LRU策略，这里就更新lru time
                val->lru = LRU_CLOCK();
            }
        }
    } else {
        ...
    }

    return val;
}

然后在处理指令时，如果发现缓存达到了预设值，会触发内存淘汰策略：

int processCommand(client *c) 
{
...

    if (server.maxmemory && !isInsideYieldingLongCommand()) {
        //达到了预设值了，这里开始处理内存淘汰逻辑
        int out_of_memory = (performEvictions() == EVICT_FAIL);
        ...
    }

...
}

//伪代码
int performEvictions(void)
{
    if (如果是LRU或者LFU策略或者volatile-ttl策略）
    {
        while (memFree < memNeedFree) 
        {
            for (i = 0; i < server.dbnum; i++) {
                db = server.db+i;
                dict = (如果淘汰策略是针对allkeys) ? db->dict : db->expires;
                if (只要dict里有数据) {
                    evictionPoolPopulate(i, dict, db->dict, 淘汰候选池);
                }
            }
        }
    }
    else if (如果是两种随机策略)
    {
        for (i = 0; i < server.dbnum; i++) {
            //用一个静态变量next_db，这样每次都不会只命中第一个db
            j = (++next_db) % server.dbnum;
            db = server.db + j;
            dict = (如果淘汰策略是针对allkeys) ? db->dict : db->expires;
            bestkey = 随机找一个key
            break;
        }
    }
    
    for (k = 淘汰候选池大小-1; k >= 0; k--) {
          bestkey = 从候选池里逆序找真实存在的key    
    }
    
    if (bestkey) {
        最后，在这里回收这个key;
        memFree += 新释放的内存；
    }
    
    //while执行太久了，break掉
    if (流逝的时间 > eviction_time_limit_us) {
        break;
    }
}

开始处理淘汰策略，并将合适的key放入淘汰候选池内，这个池是已从左到右从小到大排好序的：

void evictionPoolPopulate(int dbid, 
        dict *sampledict, //如果策略是allkey，则是db->dict,
        //如果是volatile则为db->expires
        dict *keydict, //db->dict
        struct evictionPoolEntry *pool) //这个是候选池
{
    //这里开始采样
    //server.maxmemory_samples是一个预设值，官方建议设置为10
    count = dictGetSomeKeys(sampledict, samples, server.maxmemory_samples);
    
    for (j = 0; j < count; j++) {
        ...
        
        if (server.maxmemory_policy & MAXMEMORY_FLAG_LRU) {
            //因为每次key在被loopupKey的时候，都会更新它自己的lru时间
            //这个函数：lru当前时间 - 当前这个key的lru时间
            idle = estimateObjectIdleTime(o);
        } else if (server.maxmemory_policy & MAXMEMORY_FLAG_LFU) {
            //取lfu的计数器的计数，这里是255 - 数值，因为最小访问次数的要被淘汰
            //注意这里顺带给它减少了LFU计数
            idle = 255-LFUDecrAndReturn(o);
        } else if (server.maxmemory_policy == MAXMEMORY_VOLATILE_TTL) {
            //常量 - val
            idle = ULLONG_MAX - (long)dictGetVal(de);
        } else {
            
        }
        
        ...
    }
}