Redis 缓存(Cache)

什么是缓存

缓存(cache)是计算机中的一个经典的概念在很多场景中都会涉及到。

核心思路就是把一些常用的数据放到触手可及(访问速度更快)的地方，方便随时读取。

这里所说的“触手可及”是个相对的概念

我们知道，对于硬件的访问速度来说，通常情况下：

CPU 寄存器 > 内存 > 硬盘 > 网络

那么硬盘相对于网络是“触手可及的"，就可以使用硬盘作为网络的缓存

内存相对于硬盘是"触手可及的”，就可以使用内存作为硬盘的缓存

CPU 寄存器相对于内存是"触手可及的，就可以使用 CPU 寄存器作为内存的缓存

对于计算机硬件来说，往往访问速度越快的设备，成本越高，存储空间越小

缓存是更快，但是空间上往往是不足的。因此大部分的时候，缓存只放一些热点数据(访问频繁的数据)就非常有用了。

关于二八定律：20% 的热点数据能够应对 80% 的访问场景，因此只需要把这少量的热点数据缓存起来，就可以应对大多数场景，从而在整体上有明显的性能提升。

使用 Redis 作为缓存

在一个网站中，我们经常会使用关系型数据库(比如MySQL)来存储数据。

关系型数据库虽然功能强大，但是有一个很大的缺陷，就是性能不高。(换而言之,进行一次查询操作消耗的系统资源较多)

为什么说关系型数据库性能不高?

数据库把数据存储在硬盘上，硬盘的 IO 速度并不快尤其是随机访问
如果查询不能命中索引，就需要进行表的遍历，这就会大大增加硬盘 IO 次数
关系型数据库对于 SOL 的执行会做一系列的解析，校验，优化工作
如果是一些复杂查询，比如联合查询，需要进行笛卡尔积操作，效率更是降低很多

因此，如果访问数据库的并发量比较高，对于数据库的压力是很大的，很容易就会使数据库服务器宕机。

为什么并发量高了就会宕机?

服务器每次处理一个请求，都是需要消耗一定的硬件资源的。所谓的硬件资源包括不限于 CPU，内存，硬盘，网络带宽…

一个服务器的硬件资源本身是有限的，一个请求消耗一份资源，请求多了自然把资源就耗尽了。后续的请求没有资源可用，自然就无法正确处理。更严重的还会导致服务器程序的代码出现崩溃。

如何让数据库能够承担更大的并发量呢?

核心思路主要是两个：

开源：引入更多的机器，部署更多的数据库实例，构成数据库集群(主从复制,分库分表等…)
节流：引入缓存使用其他的方式保存经常访问的热点数据从而降低直接访问数据库的请求数量

实际开发中，这两种方案往往是会搭配使用的。

Redis 就是一个用来作为数据库缓存的常见方案

Redis 访问速度比 MySOL 快很多。或者说处理同一个访问请求，Redis 消耗的系统资源比 MySQL 少很多。因此 Redis 能支持的并发量更大。

Redis 数据在内存中，访问内存比硬盘快很多
Redis 只是支持简单的 key-value 存储，不涉及复杂查询的那么多限制规则

在这里插入图片描述

客户端访问业务服务器，发起查询请求
业务服务器先查询 Redis，看想要的数据是否在 Redis 中存在
- 如果已经在 Redis 中存在了就直接返回此时不必访问 MySQL 了
- 如果在 Redis 中不存在，再查询 MySQL

按照二八定律，只需要在 Redis 中放 20% 的热点数据，就可以使 80% 的请求不再真正查询数据库了

绝大多数情况下，使用缓存都能够大大提升整体的访问效率，降低数据库的压力

注意：缓存是用来加快"读操作”的速度的，如果是"写操作"还是要老老实实写数据库，缓存并不能提高性能。

缓存的更新策略

接下来还有一个重要的问题，到底哪些数据才是“热点数据”呢？

定期生成

每隔一定的周期(比如一天/一周/一个月)，对于访问的数据频次进行统计。挑选出访问频次最高的前 N% 的数据。

以搜索引擎为例：

用户在搜索引擎中会输入一个“查询词”有些词是属于高频的，大家都爱搜(鲜花，蛋糕，同城交友…)。有些词就属于低频的，大家很少搜

搜索引擎的服务器会把哪个用户什么时间搜了啥词，都通过日志的方式记录的明明白白。然后每隔一段时间对这期间的搜索结果进行统计(日志的数量可能非常巨大，这个统计的过程可能需要使用 hadoop 或者 spark 等方式完成)，从而就可以得到“高频词表”。

这种做法实时性较低，对于⼀些突然情况应对的并不好。

比如春节期间，“春晚"这样的词就会成为非常高频的词，而平时则很少会有人搜索"春晚”。

实时生成

先给缓存设定容量上限(可以通过 Redis 配置文件的 maxmemory 参数设定)。

接下来把用户每次查询：

如果在 Redis 查到了，就直接返回
如果 Redis 中不存在，就从数据库查，把查到的结果同时也写入 Redis

如果缓存已经满了(达到上限)，就触发缓存淘汰策略，把一些"相对不那么热门”的数据淘汰掉。

按照上述过程，持续一段时间之后 Redis 内部的数据自然就是“热门数据”了

通用的淘汰策略主要有以下几种：

下列策略并非局限于 Redis，其他缓存也可以按这些策略展开

FIFO（First In First Out）先进先出

把缓存中存在时间最久的（也就是先来的数据）淘汰掉

LRU （Least Recently Used）淘汰最久未使用的

记录每个 key 的最近访问时间。把最近访问时间最老的 key 淘汰掉

LFU（Least Frequently Used）淘汰访问次数最少的

记录每个 key 最近一段时间的访问次数。把访问次数最少的淘汰掉

Random 随机淘汰

从所有的 key 中抽取幸运儿被随机淘汰掉