概念
- LRU 是按访问时间排序,发生淘汰的时候,把访问时间最久的淘汰掉。
- LFU 是按频次排序,一个数据被访问过,把它的频次 + 1,发生淘汰的时候,把频次低的淘汰掉。
几种LRU策略
以下集中LRU测率网上有很多,我自己结合项目加以整理。也可以选择跳过。
1. 普通LRU
- 一般使用双向链表+map实现,新数据加入链表表头
- 每当缓存命中时,将数据移动到表头
- 链表长度超过设定值,将尾部数据淘汰
缺点:当热点数据较多时,随后来了一次偶发性的操作,操作的数据较多,容易将热点数据淘汰出去。
2. LRU-K
考虑到传统LRU的缺点,改进措施是记录数据的被访问次数。维护两个LRU队列,一个数据访问次数队列,一个缓存队列。当访问达到预设值K时,加入到缓存队列中。对于偶然性的访问非热点数据时,命中次数不够,不会加入到缓存队列中,则不会挤出热点数据。
- 命中数据后,加入访问次数队列中,被访问次数+1,同普通LRU的逻辑。
- 淘汰数据。
- 当访问次数超过预设值,从此队列中移除,加入到缓存队列中,按照访问时间排序。
- 缓存队列中的数据再次被命中,按照访问时间顺序排序。
- 淘汰数据。
缺点:需要谨慎考虑K值的设定,设定过大会导致数据很难被淘汰。整体内存消耗也偏高。同时也要按照访问时间重排序。
3. 2Queue
优化重排序问题。
- 数据被访问后,加入到FIFO队列中。
- FIFO按照访问时间进行淘汰。
- 当数据再次被访问时,则移到LRU队列头部。
- 数据再次被访问,移动到头部。
- LRU队列淘汰。
4. Multi Queue
同2Queue,增加了多个FIFO队列,按照预设条件,从左到右逐级提升等级。随着数据被淘汰,从右向左逐级降级。
Redis的LRU/LFU策略
内存淘汰策略配置
- maxmemory: 指定限制内存大小。默认=0,表示无限制。
- maxmemory_policy: 指定的淘汰策略,目前有以下几种:
- noeviction: 默认值,不处理。
- allkeys-lru:对所有的key都采取LRU淘汰策略。
- volatile-lru:仅对设置了过期时间的key采取LRU淘汰。
- allkeys-random: 随机回收key。
- Volatile-random: 随机回收设置了过期时间的key。
- volatile-ttl:仅淘汰设置了过期时间的key,并淘汰生存时间更小的key。
- Volatile-lfu: 对设置了过期时间的key采取LFU策略。
- Allkeys-lfu: 对全部key采取LFU策略
- maxmemory_samples: 随机采样精度。官方表示配10更接近真实的LRU策略。
2. Redis的LRU策略
- 给每个key记录一个lru time。
- 每次访问key的时候,更新key的lru time。
- 按照策略配置。在一定范围内,找访问时间最早的key,将其淘汰。
- 具体看下面的源码分析。
3. Redis的LRU策略的缺陷
//从左到右是时间轴,每个波浪线代表一个时间单位
//竖线是当前时间点
~~~~~A~~~~~A~~~~~A~~~~A~~~~~A~~~~~A~~|
~~B~~B~~B~~B~~B~~B~~B~~B~~B~~B~~B~~B~|
~~~~~~~~~~C~~~~~~~~~C~~~~~~~~~C~~~~~~|
~~~~~D~~~~~~~~~~D~~~~~~~~~D~~~~~~~~~D|
//可以看到,如果4个key中非要淘汰一个,肉眼看出来一定是淘汰D,因为它访问的次数最少。但是由于
//当前时间点,D再次被访问,它的LRU时间又被更新了,导致D不会被淘汰,范围淘汰了C。
//这种情况就不合理,因此redis4.0版本后引入了LFU策略。
4. Redis的LFU策略
struct redisObject {
unsigned type:4;
unsigned encoding:4;
//对于lru而言,这里记录了lru time
//对于lfu而言,高24位记录LRU time,低8位记录计数器的值(最大可表示255)
unsigned lru:LRU_BITS;
int refcount;
void *ptr;
};
- 给每个key记录一个计数count。
- 由于只有8位长度,最多只能表示255,因此采用了一个因子控制count的增长速度。
- 新的key加入进来,会设置为预设值(LFU_INIT_VAL),以免为0直接被淘汰。
- 每当这个key被访问时,按照增长逻辑,增长count值。
- 每当这个key被放入到淘汰候选池内,则会降低count值。
5. 源码分析
当执行命令,命中数据时,更新数据:
//查找缓存数据时,最终都会调用此函数
//如: lookupKeyRead(), lookupKeyWrite()
robj *lookupKey(redisDb *db, robj *key, int flags) {
dictEntry *de = dictFind(db->dict,key->ptr);
...
robj *val = dictGetVal(de);
if (val) {
if (不能在执行子任务的时候 && !(flags & LOOKUP_NOTOUCH)){
if (server.maxmemory_policy & MAXMEMORY_FLAG_LFU) {
//如果是LFU策略,这里就增长LFU计数
updateLFU(val);
} else {
//如果是LRU策略,这里就更新lru time
val->lru = LRU_CLOCK();
}
}
} else {
...
}
return val;
}
然后在处理指令时,如果发现缓存达到了预设值,会触发内存淘汰策略:
int processCommand(client *c)
{
...
if (server.maxmemory && !isInsideYieldingLongCommand()) {
//达到了预设值了,这里开始处理内存淘汰逻辑
int out_of_memory = (performEvictions() == EVICT_FAIL);
...
}
...
}
//伪代码
int performEvictions(void)
{
if (如果是LRU或者LFU策略或者volatile-ttl策略)
{
while (memFree < memNeedFree)
{
for (i = 0; i < server.dbnum; i++) {
db = server.db+i;
dict = (如果淘汰策略是针对allkeys) ? db->dict : db->expires;
if (只要dict里有数据) {
evictionPoolPopulate(i, dict, db->dict, 淘汰候选池);
}
}
}
}
else if (如果是两种随机策略)
{
for (i = 0; i < server.dbnum; i++) {
//用一个静态变量next_db,这样每次都不会只命中第一个db
j = (++next_db) % server.dbnum;
db = server.db + j;
dict = (如果淘汰策略是针对allkeys) ? db->dict : db->expires;
bestkey = 随机找一个key
break;
}
}
for (k = 淘汰候选池大小-1; k >= 0; k--) {
bestkey = 从候选池里逆序找真实存在的key
}
if (bestkey) {
最后,在这里回收这个key;
memFree += 新释放的内存;
}
//while执行太久了,break掉
if (流逝的时间 > eviction_time_limit_us) {
break;
}
}
开始处理淘汰策略,并将合适的key放入淘汰候选池内,这个池是已从左到右从小到大排好序的:
void evictionPoolPopulate(int dbid,
dict *sampledict, //如果策略是allkey,则是db->dict,
//如果是volatile则为db->expires
dict *keydict, //db->dict
struct evictionPoolEntry *pool) //这个是候选池
{
//这里开始采样
//server.maxmemory_samples是一个预设值,官方建议设置为10
count = dictGetSomeKeys(sampledict, samples, server.maxmemory_samples);
for (j = 0; j < count; j++) {
...
if (server.maxmemory_policy & MAXMEMORY_FLAG_LRU) {
//因为每次key在被loopupKey的时候,都会更新它自己的lru时间
//这个函数:lru当前时间 - 当前这个key的lru时间
idle = estimateObjectIdleTime(o);
} else if (server.maxmemory_policy & MAXMEMORY_FLAG_LFU) {
//取lfu的计数器的计数,这里是255 - 数值,因为最小访问次数的要被淘汰
//注意这里顺带给它减少了LFU计数
idle = 255-LFUDecrAndReturn(o);
} else if (server.maxmemory_policy == MAXMEMORY_VOLATILE_TTL) {
//常量 - val
idle = ULLONG_MAX - (long)dictGetVal(de);
} else {
}
...
}
}