深入学习 Redis - 如何使用 Redis 作缓存？缓存更新策略？使用需要注意哪些问题（工作/重点）

一、Redis 作为缓存

1.1、缓存的基本概念

1.1.1、理解

1.1.2、缓存存什么样的数据？二八定律

1.2、如何使用 redis 作为缓存

1.3、缓存更新策略（redis 内存淘汰机制 / 重点）

1.3.1、定期生成

1.3.2、实时生成

内存淘汰策略（经典面试）

1. FIFO (First In First Out) ：先进先出

2. LRU (Least Recently Used) ：淘汰最久未使⽤的

3. LFU (Least Frequently Used) ：淘汰访问次数最少的

4. Random 随机淘汰

深入理解淘汰策略：

redis 中采用的淘汰策略

1.4、缓存使用的注意事项（重点）

1.4.1、缓存预热（Cache preheating）

1.4.2、缓存穿透（Cache penetration）

1.4.3、缓存雪崩（Cache avalanche）

1.4.4、缓存击穿（Cache breakdown）

一、Redis 作为缓存

1.1、缓存的基本概念

1.1.1、理解

缓存可以理解为，将常用的数据从放到一个访问速度更快的的地方，方便更快的随时读取.

也就是说，速度快的设备，可以作为速度慢的设备的缓存，加快读取速度。在计算机硬件中的访问速度如下：

CPU 寄存器 > 内存 > 硬盘 > 网络

最常见的就是，使用内存作为硬盘的缓存，比如 redis.....

当然硬盘也可以作为网络的缓存，比如浏览器通过 http/https 从服务器上获取数据（html、css、js、图片、视频......）并进行展示，像这样体积大，但又不经常改变的数据，就可以保存到浏览器本地硬盘上，后续在打开这个页面，就不必重新从网络获取上述数据了.

1.1.2、缓存存什么样的数据？二八定律

缓存速度虽然快，但是空间小，因此大部分情况，缓存只存放一些热点数据，就非常有用了.

这里就不得不提一下二八定律了，就是说缓存 只需要存储 20% 的热点数据，就可以应对 80% 的请求.

1.2、如何使用 redis 作为缓存

我们通常使用 redis 作为数据库（mysql）的缓存.

这是由于，数据库是非常重要的组件，但是速度又很慢，一旦短时间内有大量请求来临，就有可能使数据库压力过大，导致宕机.

为什么会压力过大，导致宕机？

服务器每次处理一个请求，都要消耗一些硬件资源（cpu、内存、硬盘、网络......），任何一种资源的消耗超出了机器提供的上限，就很容易出现故障了.

如何提高 mysql 能承担的并发量？

1. 开源：引入更多的机器，构成数据库集群，例如主从复制（即使主节点宕机，也可以通过提升从节点为主节点来解决）、分库分表.....

2. 节流：引入缓存，就是典型的方案. 把一些频繁的读取的热点数据保存到缓存上，后续再查询数据的时候，如果缓存已经存在了，就直接把从缓存上读到的数据返回，也就不在访问 mysql 了.

1.3、缓存更新策略（redis 内存淘汰机制 / 重点）

实际的工作中，如何知道 redis 中应该存储哪些数据？如何知道哪些数据使热点数据？

这就得看你使用缓存的哪种更新策略了~

1.3.1、定期生成

每隔⼀定的周期 (比如⼀天/⼀周/⼀个⽉) , 对于访问的数据频次进⾏统计，并以日志的形式记录下来，最后挑选出访问频次最⾼的前 N% 的数据，放到缓存中.

例如搜索引擎.

搜索引擎的 “查询词” 就是要关注的 “访问的数据”，通过日志，把每天（也可以按一周、一月）都使用到了哪些词，给记录下来，就可以针对这些日志进行统计（这里的统计数据量非常大，需要写个程序来统计，数量大到可能需要使用分布式系统来存储日志 HDFS），统计这一天中，每个词出现的频率，再根据频率降序排序，提取出前 20% 的词，就可以认为这些词是 “热点词” .

接下来就可以把这些热点词，以及涉及到的搜索结构都提前拎出来，放到类似 “ redis” 这样的缓存中了。

如何定期统计呢？

可以写一套离线流程（往往使用 shell，python 写脚本代码），然后通过定时任务来触发（一天更新一次、一个月更新一次......），具体的：

a）完成统计热词的过程.

b）根据热词，找到搜索结果的数据.

c）把得到缓存数据同步到缓存服务器上.

d）控制这些缓存服务器自动重启.

定期生成的优缺点

优点：实现起来比较简单，过程可控（缓存中有什么东西，是比较固定的），方便排查问题.

缺点：实时性不够，如果出现一些突发性的事件，出现了一些新的热点词，新的热词就可能对数据库带来较大的压力（缓存中查询没有，直接打到数据库），例如，过年的前几天，“春节晚会” 这个词就会变的特别高频、或者是某个突发的新闻......

1.3.2、实时生成

先给缓存设定容量上限（可以通过 Redis 配置⽂件的 maxmemory 参数设定）.

接着，之后用户每次查询：

如果在 Redis 中查到了，就直接返回.
如果 Redis 中没有，就从数据库查询，在把查到的结果写入 Redis.

经过一段时间的 “动态平衡” ，redis 中的 key 就逐渐变成了热点数据.

但是这样不停的写，redis 中的数据就会越来越多，达到 redis 配置的容量上限之后怎么办？

内存淘汰策略（经典面试）

为了解决上述问题，就可以使用以下四种 “内存淘汰策略” （以下淘汰策略不局限于 redis）：

1. FIFO (First In First Out) ：先进先出

把缓存中存在时间最久的 (也就是先来的数据) 淘汰掉.

2. LRU (Least Recently Used) ：淘汰最久未使⽤的

记录每个 key 的最近访问时间. 把最近访问时间最⽼的 key 淘汰掉.

3. LFU (Least Frequently Used) ：淘汰访问次数最少的

记录每个 key 最近⼀段时间的访问次数. 把访问次数最少的淘汰掉

4. Random 随机淘汰

从所有的 key 中抽取幸运儿被随机淘汰掉

深入理解淘汰策略：

假如在甄嬛传中，你是那个皇上，后宫佳丽三千，但实际上，你能宠幸的妃子也就那么几个（精力有限），相当于热点数据.

今天选秀一批新的小主，而你看上了其中的一个，那么就意味着后宫必有人失宠，那么到底要冷落谁呢？

FIFO：皇后最老，先冷落了.

LRU：找个太监统计最近的宠幸时间，比如，皇后(10天前)、华妃（一个月前）、熹妃（一天前），那么华妃失宠.

LFU：找个太监统计最近的宠幸次数，比如，皇后（6次）、华妃（1次）、熹妃（10次），那么华妃失宠.

Random：随机冷落一个妃子.

redis 中采用的淘汰策略

volatile-ttl（相当于 FIFO, 只不过是局限于过期的 key）在设置了过期时间的key中，根据过期时间进行淘汰，越早过期的优先被淘汰.
volatile-lru（就是 LRU，只不过局限于过期的 key）当内存不足以容纳新写⼊数据时，从设置了过期时间的key中使⽤LRU（最近最少使用）算法进行淘汰.
allkeys-lru（就是 LRU，针对所有 key）当内存不⾜以容纳新写⼊数据时，从所有key中使⽤LRU（最近最少使用）算法进行淘汰
volatile-lfu（就是 LFU，只不过局限于过期的 key） 4.0版本新增，当内存不⾜以容纳新写⼊数据时，在过期的key中，使⽤LFU算法进行删除key.
allkeys-lfu（就是 LFU，针对所有 key） 4.0版本新增，当内存不⾜以容纳新写⼊数据时，从所有key中使⽤LFU算法进行淘汰.
volatile-random 当内存不⾜以容纳新写⼊数据时，从设置了过期时间的key中，随机淘汰数据.
allkeys-random 当内存不⾜以容纳新写⼊数据时，从所有key中随机淘汰数据.
noeviction 默认策略，当内存不⾜以容纳新写⼊数据时，新写⼊操作会报错.