Redis缓冲区不会还有人不知道吧?

news2024/12/31 6:16:21

1 简介

缓冲区,用一块内存空间暂时存放命令数据,以免因

数据和命令的处理速度<发送速度

而导致数据丢失和性能问题。但缓冲区的内存空间有限,若持续:

往里写数据速度>从里读数据速度

会导致缓冲区需越来越多内存暂存数据。当缓冲区占用内存>设定上限阈值,就会出现缓冲区溢出。发生溢出,就会丢数据。不给缓冲区设上限,不就没这问题了?No!随累积数据增多,缓冲区所占内存空间越大,耗尽Redis机器可用内存时,Redis实例就会崩溃!

所以缓冲区是用来避免请求或数据丢失,使用姿势须正确,才能发挥作用。Redis所有操作命令都需通过C发给S。所以,缓冲区就是:

  • 在C、S间通信时,暂存客户端发送的命令数据或S返给C的数据结果
  • 主从节点间数据同步时,暂存主节点接收的写命令和数据

2 客户端输入、输出缓冲区

服务器端和客户端之间的缓冲区。

为避免C、S 的请求发送和处理速度不匹配,S给每个连接的C都设个输入、输出缓冲区,称为客户端输入、输出缓冲区。

  • 输入缓冲区先暂存C发来的命令,Redis主线程再从中读命令并处理
  • 当Redis主线程处理完数据,会把结果写入输出缓冲区,再通过输出缓冲区返给客户端

3 输入缓冲区溢出,怎么办?

可能溢出case:

  • 写入bigkey,如一下写入多个百万级别的集合类型数据
  • 服务器端处理请求速度过慢,如Redis主线程出现间歇性阻塞,无法及时处理正常发送的请求,导致客户端发送的请求在缓冲区越积越多

查看输入缓冲区的内存使用

要查看和Server相连的每个C对输入缓冲区的使用情况,可使用CLIENT LIST命令:

CLIENT LIST
id=5 addr=127.0.0.1:50487 fd=9 name= age=4 idle=0 flags=N db=0 sub=0 psub=0 multi=-1 qbuf=26 qbuf-free=32742 obl=0 oll=0 omem=0 events=r cmd=client

CLIENT命令返回信息虽多,只需关注:

  • 与服务器端连接的客户端信息
    案例展示的是一个客户端的输入缓冲区情况,如有多个客户端,输出结果中的addr会显示不同客户端的IP和端口号
  • 输入缓冲区相关参数:
    • cmd
      客户端最新执行的命令。这个例子中执行的是CLIENT命令。
    • qbuf
      输入缓冲区已经使用的大小。这个例子中的CLIENT命令已使用了26字节大小的缓冲区。
    • qbuf-free
      输入缓冲区尚未使用的大小。这个例子中的CLIENT命令还可以使用32742字节的缓冲区。qbuf和qbuf-free的总和就是,Redis服务器端当前为已连接的这个客户端分配的缓冲区总大小。这个例子中总共分配了 26 + 32742 = 32768字节,也就是32KB的缓冲区。

有了CLIENT LIST命令,就可通过输出结果判断C输入缓冲区的内存占用情况:
若qbuf很大,qbuf-free很小,这时输入缓冲区已占用很多内存,而且没啥空闲空间。此时,C再写入大量命令,就会引起C输入缓冲区溢出,Redis就把C连接关闭,结果就是业务程序无法进行数据存取。

通常Redis S不止服务一个C,当多个C连接占用的内存总量,超过maxmemory配置项(如4G),触发Redis数据淘汰。一旦数据被淘汰,再要访问这部分数据,就需要去后端DB读,降低业务应用访问性能。如使用多个客户端,导致Redis内存占用过大,也会导致内存溢出(out-of-memory),进而引起Redis崩溃,给业务应用造成严重影响。

须避免输入缓冲区溢出,考虑:

  • 缓冲区调大
  • 从数据命令的发送和处理速度入手。

有没有办法通过参数调整输入缓冲区的大小?没。Redis客户端输入缓冲区大小的上限阈值,在代码中就定为1G。即Redis服务器端允许为每个客户端最多暂存1G命令和数据。对一般生产环境已经合适:

  • 这个大小对于处理绝大部分客户端的请求已经够用了
  • 再大,Redis就可能因客户端占用过多内存而崩溃

所以,Redis并没有提供参数调节客户端输入缓冲区大小。如要避免输入缓冲区溢出,只能从数据命令的发送和处理速度入手,即避免客户端写入bigkey,以及避免Redis主线程阻塞。

4 输出缓冲区溢出解决方案

Redis输出缓冲区暂存Redis主线程要返回给客户端的数据。
一般主线程返回给客户端的数据,既有简单且大小固定的OK响应(例如,执行SET命令)或报错信息,也有大小不固定的、包含具体数据的执行结果(例如,执行HGET命令)。

因此,Redis为每个客户端设置的输出缓冲区也包括两部分:

  • 一个16KB固定缓冲空间,暂存OK响应和出错信息
  • 可动态增加的缓冲空间,暂存大小可变的响应结果

5 输出缓冲区溢出场景

执行了MONITOR命令;
缓冲区大小设置得不合理。

5.1 bigkey

服务器端返回大量bigkey结果。原本就会占用大量的内存空间,所以服务器端返回的结果包含bigkey,必影响输出缓冲区。

5.2 MONITOR

用来监测Redis执行的。执行这命令后,会持续输出监测到的各个命令操作:

MONITOR
OK
1600617456.437129 [0 127.0.0.1:50487] "COMMAND"
1600617477.289667 [0 127.0.0.1:50487] "info" "memory"

MONITOR输出结果会持续占用输出缓冲区,并越占越多,最后就是发生溢出。

MONITOR命令主要用在调试环境,生产环境禁止持续使用MONITOR。若线上偶尔使用MONITOR检查Redis命令执行情况,也没问题。

5.3 client-output-buffer-limit

设置缓冲区大小:

  • 设置缓冲区上限阈值
  • 设置输出缓冲区持续写入数据的数量上限阈值,和持续写入数据的时间的上限阈值

设置缓冲区大小前,需先区分客户端类型。和Redis实例进行交互的应用程序,主要使用如下客户端:

  • 常规和Redis服务器端进行读写命令交互的普通客户端(normal)
  • 订阅了Redis频道的订阅客户端(pubsub)

① normal

给normal设置缓冲区大小时,可在redis.conf设置如下:

  • normal
    当前设置的是普通客户端
  • 【1】0
    设置的缓冲区大小阈值
  • 【2】
    缓冲区持续写入量限制
  • 【3】0
    缓冲区持续写入时间限制

对于normal,它每发送完一个请求,会等到请求结果返回后,再发下一个请求-阻塞式发送。
这时,若非读取体量特大的大K,S输出缓冲区一般不会被阻塞。

所以,Redis默认把normal的缓冲区大小限制、持续写入量限制、持续写入时间限制都置0,即不限制。

② pubsub

一旦订阅的Redis频道有消息,S都会通过输出缓冲区把消息发给C。
所以,订阅C、S间的消息发送方式,不属阻塞式发送。
但若频道消息较多,也会占用较多输出缓冲区空间。

因此,要给订阅C设置缓冲区大小限制、缓冲区持续写入量限制及持续写入时间限制,Redis默认配置:

  • 32mb
    输出缓冲区的大小上限阈值,一旦实际占用的缓冲区大小超过,S就会直接关闭C的连接
  • 8mb和60
    若连续60s内对输出缓冲区的写入量超过8MB,S也会关闭C的连接

小结应对输出缓冲区溢出:

  • 避免大K操作返回大量数据结果
  • 避免在线上环境中持续使用MONITOR
  • 使用client-output-buffer-limit设置合理缓冲区大小上限或缓冲区连续写入时间和写入量上限

6 主从集群中的缓冲区

主从集群间的数据复制包括:

  • 全量复制
    同步所有数据
  • 增量复制
    只会把主从库网络断连期间主库收到的命令,同步给从库

无论在哪种形式的复制,为保证主从节点数据一致,都会用到缓冲区。

6.1 复制缓冲区的溢出问题(全量复制)

全量复制,Master(后文简称为M)在向Replica(后文简称为R)传输RDB文件同时,会继续接收C发送的写请求。

这些写命令先保存在复制缓冲区,等RDB传输完,再发给从节点执行。

主节点会为每个从节点都维护一个复制缓冲区,保证和主从节点间的数据同步。

所以,若全量复制时,R接收和加载RDB较慢,同时M接收到大量写命令,写命令在复制缓冲区中就会积压,最终溢出。

M的复制缓冲区,其实也是个用于和R连接的客户端(称为从节点客户端),使用的输出缓冲区。复制缓冲区一旦溢出,M也会直接关闭和R进行复制操作的连接,全量复制直接失败。

6.2 避免复制缓冲区发生溢出

  • 可控制M保存的数据量大小
    一般把主节点的数据量控制在2~4GB,这可让全量同步执行更快,避免复制缓冲区积压过多
  • 可通过client-output-buffer-limit配置项设置合适复制缓冲区大小
    设置依据:主节点的数据量大小、主节点的写负载压力和主节点本身的内存大小

从案例如何设置

在M执行:

config set client-output-buffer-limit replica 512mb 128mb 60
  • replica
    该配置项针对复制缓冲区
  • 512mb
    将缓冲区大小的上限设为512M
  • 128mb和60
    若连续60s内写入量>128M,也会触发缓冲区溢出

这设置何用?

假设一条写命令数据是1KB,则复制缓冲区可积压512K条(512MB/1KB = 512K)写命令。
M在全量复制期间,可承受写命令速率上限=2000条/s(128MB/1KB/60≈2000)。

这就得到一种方案,设置复制缓冲区大小时:

  • 根据写命令数据的大小 && 实际负载情况(即写命令速率),估计缓冲区中会积压的写命令数据量
  • 再和所设置的复制缓冲区大小比较,判断设置的缓冲区是否够支撑积压的写命令数据量

由于M复制缓冲区的内存开销,会是每个R客户端输出缓冲区占用内存的总和。若集群中的R很多,M内存开销就很大。所以还得控制和M连接的R个数,不要使用大规模主从集群。

小结

为避免复制缓冲区积压过多命令造成溢出,导致全量复制失败,可:

  • 控制M保存的数据量大小,并设置合理复制缓冲区大小
  • 控制R数量,避免M的复制缓冲区占用内存过多

6.3 复制积压缓冲区的溢出(增量复制)

增量复制时使用的缓冲区,这个缓冲区称为复制积压缓冲区。

M在把接收到的写命令同步给R时,同时会把这些写命令写入复制积压缓冲区。
一旦R发生网络闪断,和M重连后,R就会从复制积压缓冲区读取 断连期间 M接收到的写命令,进行增量同步:

repl_backlog_buffer。在缓冲区溢出角度来看:

  • 复制积压缓冲区是个有限的环形缓冲区
    当主节点把复制积压缓冲区写满后,会覆盖缓冲区中的旧命令数据。如果从节点还没有同步这些旧命令数据,就会造成主从节点间重新开始执行全量复制。
  • 为了应对复制积压缓冲区的溢出问题,我们可以调整复制积压缓冲区的大小,即repl_backlog_size参数值。

7 总结

使用缓冲区后,当命令数据的接收方处理速度跟不上发送方的发送速度,缓冲区可避免丢失命令数据。

按缓冲区用途,如客户端通信or主从节点复制,分为:

  • 客户端的输入和输出缓冲区
  • 主从集群中主节点上的复制缓冲区和复制积压缓冲区

从缓冲区溢出对Redis的影响的角度,把四个缓冲区分成两类总结

  • 缓冲区溢出导致网络连接关闭
    普通客户端、订阅客户端及从节点客户端,所用缓冲区本质都是Redis客户端和服务器端间,或主从节点间为传输命令数据而维护。这些缓冲区一旦溢出,处理机制都是直接关闭客户端和服务器端的连接,或主从节点间的连接。
    而网络连接关闭造成的直接影响,就是业务程序无法读写Redis,或者是主从节点全量同步失败,需重新执行。
  • 缓冲区溢出导致命令数据丢失
    M的复制积压缓冲区属环形缓冲区,一旦溢出,新写入的命令数据就会覆盖旧的命令数据,导致旧命令数据的丢失,进而导致主从节点重新全量复制。

缓冲区溢出的原因:

  • 命令数据发送过快、过大
    对普通客户端,可避免bigkey,而对复制缓冲区,就是避免过大RDB文件
  • 命令数据处理较慢
    减少Redis主线程上的阻塞操作,如使用异步删除操作
  • 缓冲区空间过小
    使用client-output-buffer-limit配置项设置合理的输出缓冲区、复制缓冲区和复制积压缓冲区大小

输入缓冲区的大小默认是固定的,无法通过配置修改,除非改源码。

FAQ

1 应用程序中使用的客户端要用缓冲区吗?

客户端需使用缓冲区,好处:

  • C、S交互,一般制定一个交互协议,C给S发数据时,按协议组装数据,写到客户端buffer,C一次性把buffer写到 os 的网络缓冲区,最后由os发给S。这样S就能从网络缓冲区中读到一整块数据,按协议解析数据。使用buffer发送数据会比一个个发送数据到服务端效率高。
  • C还可使用Pipeline批量发送命令到服务端,以提高访问性能。不使用Pipeline时,C是发一个命令、读一次结果。而使用Pipeline,C先把一批命令暂存到buffer,然后一次性把buffer中的命令发到服务端,服务端处理多个命令后批量返回结果,这可减少网络I/O次数,降低延迟,提高访问性能。Redis服务端的buffer内存也会相应增长,可以控制好Pipeline命令的数量防止buffer超限。

缓冲区的意义

无处不在,客户端缓冲区、服务端缓冲区、操作系统网络缓冲区等等,凡涉及数据交互的两端,一般都会使用缓冲区降低两端速度不匹配的影响。
没有缓冲区,就好比一个个工人搬运货物到目的地,每个工人不仅成本高,而且运输效率低。而有了缓冲区后,相当于把这些货物先装到一个集装箱里,然后以集装箱为单位,开车运送到目的地,这样既降低了成本,又提高了运输效率。
缓冲区相当于把需要运送的零散数据,进行一块块规整化,然后分批运输。

Redis服务端为客户端分配的输出缓冲区:主库上的从库输出缓冲区(slave client-output-buffer)是不计算在Redis使用的总内存,即主从同步延迟,数据积压在主库上的从库输出缓冲区中,这个缓冲区内存占用变大,不会超过maxmemory导致淘汰数据。
只有普通客户端和订阅客户端的输出缓冲区内存增长,超过maxmemory时,才会淘汰数据。

2 TCP已有读写缓冲区,redis为何单独维护读写缓冲区?

缓冲区类似队列,读写变成异步,主线程跟缓冲区交互,是什么线程负责缓冲区跟tcp的数据同步?

解决的虽都是速率不一致,缓冲问题:

  • TCP缓存解决C、S的网络及处理速度问题,偏网络速率缓冲。这是全局配置,修改后对这台宿主机上的应用都生效
  • redis的缓存则是解决redis服务器的处理速度与客户端的发送速度问题。这部分redis应用可修改。可以只针对这个redis应用粒度修改

tcp 的缓冲区面向的是网络的不可靠,redis 的缓冲区面向的是程序处理性能的不可靠。

  • TCP的缓冲区运行在Ring0内核态,由内核和网卡驱动控制,应用程序控制不到,而内核和网卡驱动,不关心发送接收了什么内容,更不会有应用层面的收发控制策略。
  • 而redis的缓冲区运行在Ring3,只关心应用层需要做什么策略,不太关心TCP层面做了什么东西的
  • redis数据与TCP发生读写,是通过内核来调度的,网卡收到数据后,发送中断告知内核数据来了,内核将数据搬送到Redis的应用层内存,然后告诉redis数据来了,redis就收到通知,可以读取数据了。

tcp的缓冲区是系统内核维护的,负责tcp的可靠传输,确认机制,窗口大小,流量控制和拥塞控制等都需要缓冲区。redis的缓冲区是redis自己用,用于client-server机制,就是老师讲的。redis主线程发送数据时就是把自己缓存区的数据拷贝到内核的tcp缓冲区,之后由内核负责发送数据到网卡,内核是通过epoll机制知道有数据要发送的。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/170681.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

ATGM332D-5N卫星导航模块介绍

ATGM332D-5N卫星导航模块简介ATGM332D-5N系列模块是12X16 尺寸的高性能BDS/GNSS 全星座定位导航模块系列的总称。该系列模块产品都是基于中科微第四代低功耗GNSS SOC单芯片—AT6558,支持多种卫星导航系统,包括中国的BDS(北斗卫星导航系统&…

BFS的入门与应用

目录 一、前言 二、BFS原理 二、BFS与最短路径 1、最短路径问题用BFS 2、迷宫(2019年省赛,填空题,lanqiaoOJ题号602) (1)字典序最小的最短路径 (2)输出路径的两种方法 三、B…

拉伯证券|今年首批游戏版号发放,机构看好春节行业景气度恢复

2023年第一批游戏版号发放。 昨日晚间,国家新闻出版署发布1月国产网络游戏审批信息,共88款游戏获批,其我国内各大游戏龙头均有所收成,包含腾讯《黎明觉悟:活力》、网易《逆水寒》(移动版)、完美…

数据治理:数据治理之道-组织机制-敏捷的治理组织

参考《一本书讲透数据治理》、《数据治理》等 组织机制:敏捷的治理组织 数据、组织、软件平台,是企业数字化转型面临的三座大山 数据:数据是企业数字化转型的根本驱动力之一,数字化转型中的企业必须做好数据治理与应用&#xff…

8Manage:分散的软件正在扼杀公司的生产力

在企业领域,数字化不仅仅是指工具能力,而是指用户如何很好地应用他们的知识来做决策,培养关系,建立声誉,以及动员同事、团队。几十年来,企业已经部署了生产力、搜索和协作平台,以提高员工和业务…

使用 tslib 库

tslib 是专门为触摸屏设备所开发的 Linux 应用层函数库,并且是开源。tslib 为触摸屏驱动和应用层之间的适配层, 它把应用程序中读取触摸屏 struct input_event 类型数据(这是输入设备上报给应用层的原始数据)并进行解析的操作过程…

ceres学习笔记(三)

学习了example中pose_graph_3d的部分,记录一下学习过程。 前言: 翻译一下readme里面的内容: ... 该示例还说明了如何将 Eigen 的几何模块与 Ceres 的自动微分功能结合使用。 为了表示方向,我们将使用 Eigen 的四元数&#xff…

测试开发 | Pytest 结合 Allure 生成测试报告

本文节选自霍格沃玆测试学院测试开发内部教材,进阶学习文末加群! 测试报告在项目中是至关重要的角色,一个好的测试报告: 可以体现测试人员的工作量; 开发人员可以从测试报告中了解缺陷的情况; 测试经理可…

锂电产业如何利用视觉检测系统降本增效?

导语:机器视觉检测已在锂电池生产的各个环节中,为产品产量与质量提供可靠保障。维视智造作为锂电池视觉检测系统提供商,为企业提供专业、系统、稳定的锂电行业解决方案,可保证0漏检,确保安全生产,全面提升生…

炫酷 RGB 之.NET nanoFramework 点灯大师

前面介绍了 .NET nanoFramework 入门,本文继续以微雪的 ESP32-S2-Pico 为例介绍 .NET nanoFramework 的开发:控制 ESP32 板载 RGB 灯 和 外接 RGB 灯。内容包含 状态灯的意义、WS2812 、HSV、PWM 等相关知识。 文章目录1. 背景2. 状态灯的意义3. 板载 LE…

萌新如何使用printf函数?

🐎作者的话 如果你搜索输入输出函数,那么你会看到输入输出流、Turbo标准库、标准输出端、stdout什么什么乱七八糟的,作为一个萌新,哪懂这些? 本文介绍萌新在前期的学习中,常用的输入输出函数及其功能~ 跳跃…

ROS2机器人编程简述humble-第二章-Controlling the Iterative Execution .3.1

2.3 ANALYZING THE BR2 BASICS PACKAGE 这一节内容有些多……前一篇:ROS2机器人编程简述humble-第二章-DEVELOPING THE FIRST NODE .2里面只有节点,没有任何实际功能。logger.cpp代码如下所示:#include "rclcpp/rclcpp.hpp"using n…

微信小程序分享的图片被裁切了。怎么让他不裁剪正常比例5:4显示

现在的效果 希望的效果 最主要的是下面的这个函数。把图片转成了5:4的临时图片 cutShareImg(doctorImg:string ){let thatthis;return new Promise((resolve) > {wx.getImageInfo({src: doctorImg, // 这里填写网络图片路径 success: (res) > {var data resconsole.l…

使用 LibreOffice 将 word 转化为 pdf 并解决中文乱码问题

目录 一、安装 LibreOffice 二、解决乱码问题 2.1 查看是否安装中文字体 2.2 准备字体 2.3 导入字体 2.4 验证 项目中有一个在线上传 word 并预览 pdf 报告的需求,因为项目部署在 ubuntu 上面,所以借助libreoffice 实现 word 转 pdf,然…

详细实例说明+典型案例实现 对枚举法进行全面分析 | C++

第五章 枚举法 目录 ●第五章 枚举法 ●前言 1.简要介绍 2.代码及结果示例(简单理解) 3.生活实例 ●二、枚举法的典型案例——鸡兔同笼&质数求解 1.鸡兔同笼 2.质数求解(枚举法) ●总结 前言 简单的来说…

最新 vue-cli 构建项目

vue-cli 构建项目 当前使用最新版本构建一个vue node项目 插件 vue-clivueelement-plusroutervuex 安装vue-cli npm install -g vue-cli安装完后 vue --version 查看版本 vue --version创建一个项目 vue create demo这里要选择版本,不同版本要相组合配置的插件…

反射的基本使用

文章目录1. 一个需求引出反射2. 反射机制2.1 Java Reflection2.2 Java 反射机制可以完成2.3 反射相关的主要类2.4 反射优点和缺点2.5 反射调用优化-关闭访问检查3. Class类3.1 基本介绍3.2 Class类的常用方法3.3 获取Class类对象3.4 哪些类型有Class对象3.5 类加载3.6 类加载流…

aws imagebuilder 理解并使用imagebuilder构建pcluster自定义ami

参考资料 ec2-image-builder-workshop Troubleshoot EC2 Image Builder 理解imagebuilder imagebuilder 使用 cinc-client 进行客户端统一配置,CINC is not Chef,而是chef的免费分发版本。 https://cinc.sh/about/ imagebuilder管道的整体逻辑如下 核…

OpenHarmony如何切换横竖屏?

前言在日常开发中,大多APP可能根据实际情况直接将APP的界面方向固定,或竖屏或横屏。但在使用过程中,我们还是会遇到横竖屏切换的功能需求,可能是通过物理重力感应触发,也有可能是用户手动触发。所以本文主要带大家了解…

Git 代码版本管理工具详解 进厂必备

目录前言Git 概述什么是版本控制?为什么需要版本控制?版本控制工具集中式分布式Git 工作机制Git安装Git 常用命令(部分)初始化本地库设置用户签名初始化本地库查看本地库状态***工作区代码编写***添加暂存区撤销工作区的修改***提交本地库***工作区修改代…