Redis 缓存(Cache)

news2024/11/24 3:47:57

什么是缓存

缓存(cache)是计算机中的一个经典的概念在很多场景中都会涉及到。

核心思路就是把一些常用的数据放到触手可及(访问速度更快)的地方,方便随时读取。

这里所说的“触手可及”是个相对的概念

我们知道,对于硬件的访问速度来说,通常情况下:

CPU 寄存器 > 内存 > 硬盘 > 网络

那么硬盘相对于网络是“触手可及的",就可以使用硬盘作为网络的缓存

内存相对于硬盘是"触手可及的”,就可以使用内存作为硬盘的缓存

CPU 寄存器相对于内存是"触手可及的,就可以使用 CPU 寄存器作为内存的缓存

对于计算机硬件来说,往往访问速度越快的设备,成本越高,存储空间越小

缓存是更快,但是空间上往往是不足的。因此大部分的时候,缓存只放一些热点数据(访问频繁的数据)就非常有用了。

关于二八定律:20% 的热点数据能够应对 80% 的访问场景,因此只需要把这少量的热点数据缓存起来,就可以应对大多数场景,从而在整体上有明显的性能提升。

使用 Redis 作为缓存

在一个网站中,我们经常会使用关系型数据库(比如MySQL)来存储数据。

关系型数据库虽然功能强大,但是有一个很大的缺陷,就是性能不高。(换而言之,进行一次查询操作消耗的系统资源较多)

为什么说关系型数据库性能不高?

  1. 数据库把数据存储在硬盘上,硬盘的 IO 速度并不快尤其是随机访问
  2. 如果查询不能命中索引,就需要进行表的遍历,这就会大大增加硬盘 IO 次数
  3. 关系型数据库对于 SOL 的执行会做一系列的解析,校验,优化工作
  4. 如果是一些复杂查询,比如联合查询,需要进行笛卡尔积操作,效率更是降低很多

因此,如果访问数据库的并发量比较高,对于数据库的压力是很大的,很容易就会使数据库服务器宕机。

为什么并发量高了就会宕机?

服务器每次处理一个请求,都是需要消耗一定的硬件资源的。所谓的硬件资源包括不限于 CPU,内存,硬盘,网络带宽…

一个服务器的硬件资源本身是有限的,一个请求消耗一份资源,请求多了自然把资源就耗尽了。后续的请求没有资源可用,自然就无法正确处理。更严重的还会导致服务器程序的代码出现崩溃。

如何让数据库能够承担更大的并发量呢?

核心思路主要是两个:

  • 开源:引入更多的机器,部署更多的数据库实例,构成数据库集群(主从复制,分库分表等…)
  • 节流:引入缓存使用其他的方式保存经常访问的热点数据从而降低直接访问数据库的请求数量

实际开发中,这两种方案往往是会搭配使用的。

Redis 就是一个用来作为数据库缓存的常见方案

Redis 访问速度比 MySOL 快很多。或者说处理同一个访问请求,Redis 消耗的系统资源比 MySQL 少很多。因此 Redis 能支持的并发量更大。

  • Redis 数据在内存中,访问内存比硬盘快很多
  • Redis 只是支持简单的 key-value 存储,不涉及复杂查询的那么多限制规则

在这里插入图片描述

  • 客户端访问业务服务器,发起查询请求
  • 业务服务器先查询 Redis,看想要的数据是否在 Redis 中存在
    • 如果已经在 Redis 中存在了就直接返回此时不必访问 MySQL 了
    • 如果在 Redis 中不存在,再查询 MySQL

按照二八定律,只需要在 Redis 中放 20% 的热点数据,就可以使 80% 的请求不再真正查询数据库了

绝大多数情况下,使用缓存都能够大大提升整体的访问效率,降低数据库的压力

注意:缓存是用来加快"读操作”的速度的,如果是"写操作"还是要老老实实写数据库,缓存并不能提高性能。

缓存的更新策略

接下来还有一个重要的问题,到底哪些数据才是“热点数据”呢?

定期生成

每隔一定的周期(比如一天/一周/一个月),对于访问的数据频次进行统计。挑选出访问频次最高的前 N% 的数据。

以搜索引擎为例:

用户在搜索引擎中会输入一个“查询词”有些词是属于高频的,大家都爱搜(鲜花,蛋糕,同城交友…)。有些词就属于低频的,大家很少搜

搜索引擎的服务器会把哪个用户什么时间搜了啥词,都通过日志的方式记录的明明白白。然后每隔一段时间对这期间的搜索结果进行统计(日志的数量可能非常巨大,这个统计的过程可能需要使用 hadoop 或者 spark 等方式完成),从而就可以得到“高频词表”。

这种做法实时性较低,对于⼀些突然情况应对的并不好。

比如春节期间,“春晚"这样的词就会成为非常高频的词,而平时则很少会有人搜索"春晚”。

实时生成

先给缓存设定容量上限(可以通过 Redis 配置文件的 maxmemory 参数设定)。

接下来把用户每次查询:

  • 如果在 Redis 查到了,就直接返回
  • 如果 Redis 中不存在,就从数据库查,把查到的结果同时也写入 Redis

如果缓存已经满了(达到上限),就触发缓存淘汰策略,把一些"相对不那么热门”的数据淘汰掉。

按照上述过程,持续一段时间之后 Redis 内部的数据自然就是“热门数据”了

通用的淘汰策略主要有以下几种:

下列策略并非局限于 Redis,其他缓存也可以按这些策略展开

  • FIFO(First In First Out)先进先出

    把缓存中存在时间最久的(也就是先来的数据)淘汰掉

  • LRU (Least Recently Used)淘汰最久未使用的

    记录每个 key 的最近访问时间。把最近访问时间最老的 key 淘汰掉

  • LFU(Least Frequently Used)淘汰访问次数最少的

    记录每个 key 最近一段时间的访问次数。把访问次数最少的淘汰掉

  • Random 随机淘汰

    从所有的 key 中抽取幸运儿被随机淘汰掉

Redis 内置的淘汰策略如下:

  • volatile-lru 当内存不足以容纳新写入数据时,从设置了过期时间的 key 中使用 LRU (最近最少使用)算法进行淘汰
  • allkeys-lru 当内存不足以容纳新写入数据时,从所有 key 中使用LRU (最近最少使用)算法进行淘汰
  • volatile-lfu 4.0版本新增,当内存不足以容纳新写入数据时,在过期的 key 中,使用 LFU 算法进行删除 key
  • allkeys-lfu 4.0版本新增,当内存不足以容纳新写入数据时,从所有 key 中使用 LFU 算法进行淘汰.
  • volatile-random 当内存不足以容纳新写入数据时,从设置了过期时间的 key 中,随机淘汰数
  • allkeys-random 当内存不足以容纳新写入数据时,从所有 key 中随机淘汰数据
  • volatile-ttl 在设置了过期时间的 key 中,根据过期时间进行淘汰,越早过期的优先被淘汰(相当于 FIFO,只不过是局限于过期的 key)
  • noeviction 默认策略,当内存不足以容纳新写入数据时,新写入操作会报错

整体来说 Redis 提供的策略和我们上述介绍的通用策略是基本一致的,只不过 Redis 这里会针对"过期“key"和“全部 key"做分别处理

缓存预热,缓存穿透,缓存雪崩和缓存击穿

缓存预热(Cache preheating)

什么是缓存预热?

使用 Redis 作为 MySQL 的缓存的时候当 Redis 刚刚启动,或者 Redis 大批 key 失效之后,此时由于 Redis 自身相当于是空着的,没啥缓存数据,那么 MySQL 就可能直接被访问到,从而造成较大的压力。

因此就需要提前把热点数据准备好,直接写到 Redis 中,使 Redis 可以尽快为 MySOL 撑起保护伞

热点数据可以基于之前介绍的统计的方式生成即可,这份热点数据不一定非得那么"准确”,只要能帮助 MySQL 抵挡大部分请求即可。随着程序运行为推移,缓存的热点数据会逐渐自动调整,来更适应当前情况。

缓存穿透(Cache penetration)

什么是缓存穿透?

访问的 key 在 Redis 和 MySQL 中都不存在,此时这样的 key 不会被放到缓存上,后续如果仍然在访问该 key,依然会访问到数据库

这就会导致数据库承担的请求太多,压力很大,这种情况称为缓存穿透

为何产生?

原因可能有几种:

  • 业务设计不合理,比如缺少必要的参数校验环节,导致非法的 key 也被进行查询了
  • 开发/运维误操作,不小心把部分数据从数据库上误删了
  • 黑客恶意攻击

如何解决?

  • 针对要查询的参数进行严格的合法性校验,比如要查询的 key 是用户的手机号,那么就需要校验当前 key 是否满足一个合法的手机号的格式。
  • 针对数据库上也不存在的 key,也存储到 Redis 中,比如 value 就随便设成一个”“,避免后续频繁访问数据库。
  • 使用布隆过滤器先判定 key 是否存在,再真正查询

布隆过滤器是结合了 hash+bitmap 的思想,能够用较少的空间,判定某个元素是否存在

缓存雪崩(Cache avalanche)

什么是缓存雪崩

短时间内大量的 key 在缓存上失效,导致数据库压力骤增,甚至直接宕机。

本来 Redis 是 MySQL 的一个护盾,帮 MySQL 抵挡了很多外部的压力。一旦护盾突然失效了,MySQL 自身承担的压力骤增,就可能直接崩溃。

为何产生?

大规模 key 失效,可能性主要有两种:

  • Redis 挂了
  • Redis 上的大量的 key 同时过期

为啥会出现大量的 key 同时过期?

这种很可能是短时间内在 Redis 上缓存了大量的 key,并且设定了相同的过期时间

如何解决?

  • 部署高可用的 Redis 集群并且完善监控报警体系
  • 不给 key 设置过期时间或者设置过期时间的时候添加随机时间因子

缓存击穿(Cache breakdown)

什么是缓存击穿?

相当于缓存雪崩的特殊情况,针对热点 key,突然过期了,导致大量的请求直接访问到数据库上,甚至引起数据库宕机.

如何解决?

  • 基于统计的方式发现热点 key,并设置永不过期
    何解决?**

  • 部署高可用的 Redis 集群并且完善监控报警体系

  • 不给 key 设置过期时间或者设置过期时间的时候添加随机时间因子

缓存击穿(Cache breakdown)

什么是缓存击穿?

相当于缓存雪崩的特殊情况,针对热点 key,突然过期了,导致大量的请求直接访问到数据库上,甚至引起数据库宕机.

如何解决?

  • 基于统计的方式发现热点 key,并设置永不过期
  • 进行必要的服务降级,例如访问数据库的时候使用分布式锁。限制同时请求数据库的并发数

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1457646.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

通过VSCode开发Python项目

一、插件准备 Python 插件,必须 autoDocstring 生成注释,和Pycharm一样输入三个引号"""会生产注释结构 Todo Tree 高亮显示 TODO/FIXME 二、python相关设置 一)设置python环境 按"F1"打开命令面板(…

19. 【Linux教程】nano 编辑器

前面小节介绍了如何使用 vim 编辑器,相比于 vim 编辑器,nano 编辑器就比较简单了。nano 是 UNIX 系统中的一个文本编辑器,大部分 Linux 发行版本默认都安装了 nano 文本编辑器。 和 vim 编辑器相比,nano 编辑器就没有那么强大&am…

centos7 arm服务器编译安装onnxruntime-gpu

前言 ONNX Runtime是适用于Linux,Windows和Mac上ONNX格式的机器学习模型的高性能推理引擎,但在arm服务器上,onnxruntime只有CPU版的,GPU版的没有,因此需要自行去编译GPU版本的才可以。 环境准备 1、python3.8 2、cmake:2.26.0版本以上,可以直接下载aarch64版本的进行…

LeetCode42.接雨水(单调栈)

题目 给定 n 个非负整数表示每个宽度为 1 的柱子的高度图,计算按此排列的柱子,下雨之后能接多少雨水。 示例 : 输入:height [0,1,0,2,1,0,1,3,2,1,2,1] 输出:6 解释:上面是由数组 [0,1,0,2,1,0,1,3,2,…

​中国手游发行商收入TOP30!

SensorTower 数据 2024年1月中国手游发行商,全球多款游戏在收入和用户增长方面取得的显著成绩。 1. 中国手游发行商全球表现:2024年1月,共有38个中国厂商入围全球手游发行商收入榜TOP100,合计收入达到19.6亿美元,占榜单…

PDF控件Spire.PDF for .NET【安全】演示:如何在 PDF 中添加签名字段

Spire.PDF for .NET 是一款独立 PDF 控件,用于 .NET 程序中创建、编辑和操作 PDF 文档。使用 Spire.PDF 类库,开发人员可以新建一个 PDF 文档或者对现有的 PDF 文档进行处理,且无需安装 Adobe Acrobat。 E-iceblue 功能类库Spire 系列文档处…

mysql mgr集群部署

一、前言 mysql mgr集群是为了实现mysql高可用,分为单主集群和多主集群,单主集群只有一个主节点可写,节点发生故障时,自动进行主从的故障切换,多主集群所有节点都可写,当节点发生故障时,将故障节…

【RPG Maker MV 仿新仙剑 战斗场景UI (二)】

RPG Maker MV 仿新仙剑 战斗场景UI 二 战斗指令菜单原仙剑战斗指令图RMMV战斗指令对应代码战斗指令菜单代码效果 战斗指令菜单 原仙剑战斗指令菜单是使用方向键控制,同时按照使用情况正好对应四个指令和四个方向,同时没有选中的菜单用黑色透明图片覆盖&…

层级关联,审批人功能

一个需求要求选择一级&#xff0c;下方展示一级的效果 后端给了审批人数据&#xff0c;但是数据需要单独处理 <template><div class"box"><el-form :model"ruleForm" :rules"rules" ref"ruleForm" label-width"…

【鸿蒙系统学习笔记】ArkTS开发语言

一、背景 ArkTS是HarmonyOS优选的主力应用开发语言。ArkTS围绕应用开发在TypeScript&#xff08;简称TS&#xff09;生态基础上做了进一步扩展&#xff0c;继承了TS的所有特性&#xff0c;是TS的超集。 二、基本语法 2.1、基本语法介绍 ArkTS的基本组成&#xff0c;资料来自…

【洛谷题解】P8627 [蓝桥杯 2015 省 A] 饮料换购

题目链接&#xff1a;[蓝桥杯 2015 省 A] 饮料换购 - 洛谷 题目难度&#xff1a;普及- 涉及知识点&#xff1a;换购 题意&#xff1a; 分析&#xff1a;一直换购直至瓶盖数<3为只 AC代码&#xff1a; #include<bits/stdc.h> using namespace std; int main() {i…

极其抽象的SpringSecurity理解

原始&#xff1a;A → B Security&#xff1a;A → S → B 太抽象了&#xff0c;看不懂啊T_T 抽象故事 故事大概&#xff1a;C是一个大区&#xff0c;拥有巨大的火力&#xff08;C准备联合B吞并掉A&#xff09;&#xff0c;A得到了这个消息&#xff0c;…

java:Java中的逻辑控制

顺序结构 在Java中&#xff0c;顺序结构是指代码按照从上到下的顺序依次执行。以下是一个简单的Java程序示例&#xff0c;展示了顺序结构的使用&#xff1a; public class SequenceStructureExample {public static void main(String[] args) {// 声明和初始化变量int num1 10…

51-2 万字长文,深度解读端到端自动驾驶的挑战和前沿

去年初&#xff0c;我曾打算撰写一篇关于端到端自动驾驶的文章&#xff0c;发现大模型在自动驾驶领域的尝试案例并不多。遂把议题扩散了一点&#xff0c;即从大模型开始&#xff0c;逐渐向自动驾驶垂直领域靠近&#xff0c;最后落地到端到端。这样需要阐述的内容就变成LLM基础模…

SAP PP学习笔记 - 豆知识05 - 如何定义品目状态,如何删除品目,如何扩张品目

本章讲SAP 中一些常用操作。 - 设定品目状态&#xff1a;控制让一个品目&#xff08;物料&#xff09;准备好了以后再提供出来给大家 - 删除品目&#xff1a;一般来说是逻辑删除&#xff0c;但是做了归档之后&#xff0c;也可以物理删除 - 扩张品目&#xff1a;品目的View非…

《最新出炉》系列初窥篇-Python+Playwright自动化测试-19-处理鼠标拖拽-中篇

1.简介 上一篇中&#xff0c;主要是介绍了拖拽的各种方法的理论知识以及实践&#xff0c;今天宏哥讲解和分享一下划取字段操作。例如&#xff1a;需要在一堆log字符中随机划取一段文字&#xff0c;然后右键选择摘取功能。 2.划取字段操作 划取字段操作就是在一段文字中随机选…

[BUUCTF]-PWN:axb_2019_heap解析(格式化字符串漏洞,unlink,off by one)

查看保护 查看ida 大致就是alloc创建堆块&#xff0c;free释放堆块&#xff0c;以及fill填充堆块 解释get input函数&#xff1a; 这里解释一下get input函数 这个函数是人工编写的&#xff0c;其中*v410那里是把接受到的换行符变为\x00&#xff0c;并且结束输入。 v3那里&a…

单调队列和优先队列

本篇记录下一下关于单调队列和优先队列&#xff08;堆&#xff09;的方法以及解题思路. 文章目录 一. 单调队列1. 绝对差不超过限制得最长连续子数组2. 跳跃游戏 VI3. 设计自助结算系统4. 和至少为k的最短子数组5. 满足不等式的最大值 二. 优先队列1. 最后一块石头的重量2. 数据…

CoWoS封装产能短缺挑战AI芯片市场需求

随着人工智能、云计算、大数据分析和移动计算等技术的蓬勃发展&#xff0c;现代社会对计算能力的需求日益高涨。然而&#xff0c;在先进制程突破3纳米后&#xff0c;晶圆尺寸遭遇缩放极限&#xff0c;制造成本也随之上升。因此&#xff0c;除了继续研发先进制程外&#xff0c;半…

网络防火墙综合实验

备注&#xff1a;电信网段15.1.1.0 移动网段14.1.1.0 办公区 11.1.1.0 生产区 10.1.1.0 服务区 13.1.1.0 公网 1.1.1.1 和 2.2.2.2 需求&#xff1a; 1、办公区设备可以通过电信链路和移动链路上网&#xff08;多对多nat&#xff0c;并且需要保留一个公网ip&#xff09; 2、…