用户数据一般都是存储在数据库中,数据库则落在磁盘上。而磁盘的I/O速度是计算机中最慢的硬件。
当用户的访问量在某一个时间段突然上升,数据库就很容易崩溃。为了避免用户直接访问数据库,所以会使用缓存数据库(Redis)作为缓冲层。
Redis 是内存数据库,将数据库的一部分数据缓存在 Redis 里,相当于数据缓存在内存中;而内存的读写速度比硬盘快好几个数量级,这样大大提高了系统性能。
缓存雪崩
为了保证缓存中的数据与数据库中的数据一致性,会给 Redis 里的数据设置过期时间;当缓存数据过期后,用户访问的数据如果不在缓存里,业务系统需要重新生成缓存,因此就会访问数据库,并将数据更新到 Redis 里,这样后续请求都可以直接命中缓存。
如果在某一时间,大量的缓存数据在该时间过期或者Redis故障宕机。
此时,大量的用户请求都无法被Redis处理,这些命令就会直接访问数据库,从而导致数据库的压力骤增,甚至会导致数据库宕机;从而引发一系列的问题,造成整个系统崩溃。这就是缓存雪崩。
解决办法
对于大量的数据在同一时间过期:
- 均匀的设置过期时间:以在对缓存数据设置过期时间时,给这些数据的过期时间加上一个随机数,这样就保证数据不会在同一时间过期。
- 互斥锁:当业务线程在处理用户请求时,如果发现访问的数据不在 Redis 里,就加个互斥锁,保证同一时间内只有一个请求来构建缓存(从数据库中读取数据并返回Redis构建缓存数据)
- 后台更新缓存:业务线程不再负责更新缓存,缓存也不设置有效期;将更新缓存的工作交由后台线程定时更新。
对于Redis故障宕机
- 服务熔断或请求限流机制;
- 构建 Redis 缓存高可靠集群;
缓存击穿
有些业务通常会有几个数据会被频繁地访问,比如秒杀活动,这类被频地访问的数据被称为热点数据。
如果缓存中的某个热点数据过期了,此时大量的请求访问了该热点数据,就无法从缓存中读取,而是直接访问数据库;数据库很容易就被高并发的请求冲垮,这就是缓存击穿的问题。
缓存击穿是缓存雪崩的一种特殊情况。解决方案:
- 互斥锁
- 不给热点数据设置过期时间,由后台异步更新缓存。
缓存穿透
当访问的数据,既不在缓存中,也不在数据库中,导致请求在访问缓存时,发现缓存缺失,再去访问数据库时,发现数据库中也没有要访问的数据,没办法构建缓存数据,来服务后续的请求。
那么当有大量这样的请求到来时,数据库的压力骤增,这就是缓存穿透的问题。
缓存穿透一般发生在数据库被恶意攻击或者业务误操作。
解决方案
- 非法请求限制
- 缓存空值或者默认值
- 使用布隆过滤器过滤访问不存在的数据的请求。
布隆过滤器的原理可参考文章:位图和布隆过滤器