Redis高阶篇之Redis单线程与多线程

news2024/10/21 10:36:07

文章目录

  • 0 前言
  • 1. 为什么Redis是单线程?
    • 1.1 Redis单线程
    • 1.2 为什么Redis3时代单线程快的原因
    • 1.3 使用单线程原因
  • 2.为什么逐渐加入多线程呢?
    • 2.1 如何解决
  • 3.redis6/7的多线程特性和IO多路复用入门
    • 3.1主线程和IO线程怎么协作完成请求处理的
    • 3.2 Unix网络编程中的五种IO模型
    • 3.3 首次浅谈IO多路复用
    • 3.4 场景体验,引出epoll
      • 3.4.1 场景解析
      • 3.4.2 IO多路复用模型,简单明了版理解
  • 4 Redis7是否开启了多线程
  • 5.总结

0 前言

  之前写过关于Redis的十篇文章,关于Redis快的原因是单线程执行指令和IO多路复用比较笼统,所以打算单开一篇文章深入介绍Redis单线程与多线程。以及Redis不同版本的多线程和IO多路复用情况。

1. 为什么Redis是单线程?

  换一个严谨的说法把应该说Redis3.XX是大家口口相传的单线程。就跟大伙熟知的java支持泛型,是java5开始支持的,java5之前是不支持的。
  Redis4之后开始支持多线程,知道Redis6/7之后才开始稳定的。严格意义来说也不是单线程,而是负责处理客户端请求的线程是单线程,但是开始加了点多线程的东西(异步删除)。准确的说,是部分多线程才对。
  2020年5月版本的6.0.x后及2022年出的7.0版本后,告别了大家印象中的单线程,用一种全新的多线程来解决问题。
  Redis几个重要版本的里程碑如下图所示:
在这里插入图片描述
  5.0版本是直接升级到6.0版本,对于这个激进的升级,Redis之父antirez表现得很有信心和兴奋,所以第一时间发文来阐述6.0的一些重大功能"Redis 6.0.0 GA is out!"。当然,Redis7.0后版本更加厉害。

1.1 Redis单线程

  主要是指Redis的网络IO和键值对读写是由一个线程来完成的,Redis在处理客户端的请求时包括获取(socket读)、解析、执行、内容返回(socket 写)等都由一个顺序串行的主线程处理,这就是所谓的“单线程”。这也是Redis对外提供键值存储服务的主要流程。
在这里插入图片描述
  但Redis的其他功能,比如持久化RDB、AOF、异步删除、集群数据同步等等,其实是由额外的线程执行的。Redis命令工作线程是单线程的,但是,整个Redis来说,是多线程的。

1.2 为什么Redis3时代单线程快的原因

  1.基于内存操作: Redis 的所有数据都存在内存中,因此所有的运算都是内存级别的,所以他的性能比较高; 数据结构简单:Redis 的数据结构是专门设计的,而这些简单的数据结构的查找和操作的时间大部分复杂度都是 0(1),因此性能比较高;
  2.多路复用和非阻塞 I/O: Redis使用 I/O多路复用功能来监听多个 socket连接客户端,这样就可以使用一个线程连接来处理多个请求,减少线程切换带来的开销,同时也避免了 I/O 阻塞操作;
  3.避免上下文切换:因为是单线程模型,因此就避免了不必要的上下文切换和多线程竞争,这就省去了多线程切换带来的时间和性能上的消耗,而且单线程不会导致死锁问题的发生。

1.3 使用单线程原因

本小结将是官网证据:Redis管网
旧版本Redis官网说明,说Redis就是单线程

Redis是单线程的。如何利用多个CPU /内核? CPU并不是您使用Redis的瓶颈,因为通常Redis要么受内存限制,要么受网络限制。例如,使用在平均Linux系统上运行的流水线Redis每秒可以发送一百万个请求,因此,如果您的应用程序主要使用O(N)或O(log(N) )命令,则几乎不会使用过多的CPU。
  但是,为了最大程度地利用CPU,您可以在同一框中启动多个Redis实例,并将它们视为不同的服务器。在某个时候,单个盒子可能还不够,因此,如果您要使用多个CPU,则可以开始考虑更早地进行分片的某种方法。您可以在“分区”页面中找到有关使用多个Redis实例的更多信息。
  但是,在Redis 4.0中,我们开始使Redis具有更多线程,目前,这仅限于在后台删除对象,以及阻正通过Redis模块实现的命令。对于将来的版本,计划是使Redis越来越线程化。
  他的大体意思是说 Redis 是基于内存操作的, 因此他的瓶颈可能是机器的内存或者网络带宽而并非 C P U \textcolor{red}{\large 因此他的瓶颈可能是机器的内存或者网络带宽而并非 CPU} 因此他的瓶颈可能是机器的内存或者网络带宽而并非CPU,既然 CPU 不是瓶颈,那么自然就采用单线程的解决方案了,况且使用多线程比较麻烦。 但是在 R e d i s 4.0 中开始支持多线程了,例如后台删除、备份等功能。 \textcolor{red}{\large 但是在 Redis 4.0 中开始支持多线程了,例如后台删除、备份等功能。} 但是在Redis4.0中开始支持多线程了,例如后台删除、备份等功能。
新版本Redis官网原话,去掉了单线程的
4.0之前一直采用单线程的主要原因有以下三个:
  1.使用单线程模型是 Redis 的开发和维护更简单,因为单线程模型方便开发和调试;
  2.即使使用单线程模型也并发的处理多客户端的请求,主要使用的是IO多路复用和非阻塞IO;
  3.对于Redis系统来说, 主要的性能瓶颈是内存或者网络带宽而并非 C P U 。 \textcolor{red}{\large 主要的性能瓶颈是内存或者网络带宽而并非 CPU。} 主要的性能瓶颈是内存或者网络带宽而并非CPU

2.为什么逐渐加入多线程呢?

  如今的主机CPU都是多核时代的,一直守着单线程,而不能解决实际的问题那未免过于故步自封了。
  单线程也有苦恼,举个例子说明:
正常情况下使用 del 指令可以很快的删除数据,而当被删除的 key 是一个非常大的对象时,例如key包含了成千上万个元素的 hash 集合时,那么 del 指令就会造成 Redis 主线程卡顿。
  这就是Redis 3.X单线程时代最经典的故障,大key删除的头疼问题,由于redis是单线程的,del bigKey 要等待很久这个线程才会释放,类似加了一个synchronized锁,你可以想象高并发下,程序堵成什么样子?

2.1 如何解决

  1.使用惰性删除可以有效的解决性能问题。
2.案例
  比如当我(Redis)需要删除一个很大的数据时,因为是单线程原子命令操作,这就会导致 Redis 服务卡顿,于是在 Redis 4.0 中就新增了多线程的模块,当然此版本中的多线程主要是为了解决删除数据效率比较低的问题。
  在这里插入图片描述
  因为Redis是单个主线程处理,redis之父antirez一直强调"Lazy Redis is better Redis"。
  而lazy free的本质就是把某些cost(主要时间复杂度,占用主线程cpu时间片)较高删除操作,从redis主线程剥离让bio子线程来处理,极大地减少主线阻塞时间。从而减少删除导致性能和稳定性问题。
  3.在Redis4.0就引入了多个线程来实现数据的异步惰性删除等功能但是其处理读写请求的仍然只有一个线程,所以仍然算是狭义上的单线程。

3.redis6/7的多线程特性和IO多路复用入门

  对于Redis主要的性能瓶颈是内存或者网络带宽而并非 CPU。
在这里插入图片描述

  所以Redis的瓶颈可以初步定为:网络IO。
  1.Redis 6/7,真正的多线程登场。
  2.在Redis 6/7中,非常受关注第一个新特性就是多线程 。
  这是因为,Redis一直被大家熟知的就是它的单线程架构,虽然有些命令操作可以用后台线程或子进程执行(比如数据删除、快照生成、AOF重写)但是,从网络IO处理到实际的读写命令处理,都是由单个线程完成的。
  随着网络硬件的性能提升,Redis的性能瓶颈有时会出现在网络IO的处理上,也就是说,单个主线程处理网络请求的速度跟不上底层网络硬件的速度。
  为了应对这个问题,采用多个I0线程来处理网络请求,提高网络请求处理的并行度,Redis6/7就是采用的这种方法。
  但是,Redis的多IO线程只是用来处理网络请求的,对于读写操作命今Redis仍然使用单线程来处理。这是因为,Redis处理请求时,网络处理经常是瓶颈,通过多个IO线程并行处理网络操作,可以提升实例的整体处理性能。而继续使用单线程执行命今换作,就不用为了保证Lua脚本、事务的原子性,额外开发多线程互斥加锁机制了(不管加锁操作处理) ,这样一来,Redis线程模型实现就简单了。

3.1主线程和IO线程怎么协作完成请求处理的

  阶段一: 服务端和客户端建立Socket连接,并分配处理线程
  首先,主线程负贵接收建立连接请求。当有客户端请求和实例建立Socket连接时,主线程会创建和客户端的连接,并把 Socket放入全局等待队列中。紧接着,主线程通过轮询方法把Socket连接分配给I0线程
  阶段二: IO线程读取并解析请求
主线程一旦把Socket分配给IO线程,就会进入阻塞状态,等待10线程完成客户端请求读取和解析。因为有多个0线程在并行处理,所以,这个过程很快就可以完成。
  阶段三: 主线程执行请求操作
等到10线程解析完请求,主线程还是会以单线程的方式执行这些命令操作。
  阶段四: IO线程回写Socket和主线程清空全局队列
当主线程执行完请求操作后,会把需要返回的结果写入缓冲区,然后,主线程会阻塞等待IO线程,把这些结果回写到Socket中,并返回给客户端。和IO线程读取和解析请求一样,IO线程回写Socke时,也是有多个线程在并发执行,所以回写Socket的速度也很快。等到IO线程回写Socket完毕,主线程会清空全局队列,等待客户端的后请求
在这里插入图片描述

3.2 Unix网络编程中的五种IO模型

  1.Blocking IO - 阻塞IO
  2.NoneBlocking IO - 非阻塞IO
  3.IO multiplexing - IO 多路复用
  4.Linux世界一切皆是文件
  文件描述符,简称FD,句柄
  FileDescriptor:文件描述符 (File descriptor)是计算机科学中的一个术语,是一个用于表述指向文件的引用的抽象化概念。文件描述符在形式上是一个非负整数。实际上,它是一个索引值,指向内核为每一个进程所维护的该进程打开文件的记录表。当程序打开一个现有文件或者创建一个新文件时,内核向进程返回一个文件描述符。在程序设计中,文件描述符这一概念往往只适用于UNIX、Linux这样的操作系统。

3.3 首次浅谈IO多路复用

一种同步的IO模型,实现一个线程监视多个文件句柄,一旦某个文件句柄就绪就能够通知到对应应用程序进行相应的读写操作,没有文件句柄就绪时就会阻塞应用程序从而释放CPU资源。
  概念: l/O:网络I/O,尤其在操作系统层面指数据在内核态和用户态之间的读写操作。
  多路:多个客户端连接(连接就是套接字描述符,即 socket 或者 channel)

  复用:复用一个或几个线程
   lO多路复用:也就是说一个或一组线程处理多个TCP连接,使用单进程就能够实现同时处理多个客户端的连接,无需创建或者维护过多的进程/线程
  一句话:一个服务端进程可以同时处理多个套接字描述符。 实现IO多路复用的模型有3种: 可以分select->poll->epoll三个阶段来描述。​
  signal driven IO - 信号驱动IO
  asynchronous IO - 异步IO

3.4 场景体验,引出epoll

3.4.1 场景解析

  模拟一个tcp服务器处理30个客户socket。
  假设你是一个监考老师,让30个学生解答一道竞赛考题,然后负责验收学生答卷,你有下面几个选择: 第一种选择(轮询):按顺序逐个验收,先验收A,然后是B,之后是C、D。。。这中间如果有一个学生卡住,全班都会被耽误,你用循环挨个处理socket,根本不具有并发能力。
  第二种选择(来一个new一个,1对1服):你创律30个分身线程,每个分身线程检查一个学生的答案是否正确。这种类似于为每一个用户创建一个进程或者线程处理连接。
   第三种选择(响应式处理,1对多服务):你站在讲台上等,谁解答完谁举手。这时C、D举手,表示他们解答问题完毕,你下去依次检查C、D的答案然后继续回到讲台上等] 此时E、A又举手,然后去处理E和A。。。这种就是IO复用模型。 Linux下的select、poll和epoll就是干这个的。

3.4.2 IO多路复用模型,简单明了版理解

  将用户socket对应的文件描述符(FileDescriptor)注册进epoll,然后epoll帮你监听哪些socket上有消息到达,这样就避免了大量的无用操作。此时的socket应该采用非阻塞模式。这样,整个过程只在调用select、poll、epoll这些调用的时候才会阻塞,收发客户消息是不会阻塞的,整个进程或者线程就被充分利用起来,这就是事件驱动,所谓的reactor反应模式。
在这里插入图片描述

  在单个线程通过记录跟踪每一个Sockek(I/0流)的状态来同时管理多个I/0流,一个服务端进程可以同时处理多个套接字描述符。目的是尽量多的提高服务器的吞吐能力。
  大家都用过nginx,nginx使用epoll接收请求,ngnix会有很多链接进来,epoll会把他们都监视起来,然后像拨开关一样,谁有数据就拨向谁然后调用相应的代码处理。redis类似同理,这就是IO多路复用原理,有请求就响应,没请求不打扰。
   总之,只使用一个服务端进程可以同时处理多个套接字描述符连接。
  备注:IO多路复用+epoll函数使用,才是redis为什么这么快的直接原因,而不是仅仅是单线程命令+redis安装在内存中。
  从Redls6开始,就新增了多线程的功能来提高I/O的读写性能,他的主要实现思路是将主线程的 IO 读写任务拆分给一组独立的线程去执行。这样就可以使多个 socket 的读写可以并行化了,采用多路 I/O 复用技术可以让单个线程高效的处理多个连接请求(尽量减少网络IO的时问消耗),将最耗时的Socket的读取、请求解析、写入单独外包出去,剩下的命令执行仍然由主线程串行执行并和内存的数据交互。
在这里插入图片描述
  结合上图可知,网络IO操作就变成线程化了,其他核心部分仍然是线程安全的,是个不错的折中办法。

  Redis6/7将网络数据读写、请求协议解析通过多个IO线程来处理,对于真正的命令执行来说,仍然使用主线程操作,个IO线程的来处理一举两得。
在这里插入图片描述

4 Redis7是否开启了多线程

  如果你在实际应用中,发现Redis实例的CPU开销不大但吞吐量却没有提升,可以考虑使用Redis7的多线程机制,加速网络处理,进而提升实例的吞吐量。

Redis7将所有数据放在内存中,内存的响应时长大约为100纳秒,对于小数据包,Redis服务器可以处理8W到10W的QPS。
这也是Redis处理的极限了,对于80%的公司来说,单线程的Redis已经足够使用了。

  1.设置io-thread-do-reads配置项为yes,表示启动多线程。
  2.设置线程个数。关于线程数的设置,官方的建议是如果为4核的CPU,建议线程数设置为2或3,如果为8核CPU建议线程数设置为6,安程数一定要小于机器核数,线程数并不是越大越好。

5.总结

  Redis自身出道就是优秀,基于内存操作、数据结构简单、多路复用和非阻塞I/O、避免了不必要的线程上下文切换等特性,在单线程的环境下依然很快;
但对于大数据的 key删除还是卡顿厉害,因此在Redis 4.0引入了多线程unlink key/flushall async等命令,主要用于Redis 数捷的异步删除;
  而在Redis6/7中引入了I/0多线程的读写,这样就可以更加高效的处理更多的任务了,Redis只是将I/O读写变成了多线程,而命令的执行依旧是由主线程串行执行的,因此在多线程下操作 Redis不会出现线程安全的问题。
  Redis无论是当初的单线程设计,还是如今与当初设计相背的多线程,目的只有一个:让 Redis变得越来越快。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2219969.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

政府采购合同公告明细数据(1996-2024年)

透明度成为了公众对政府活动的基本要求之一。特别是在政府采购领域,透明度不仅关系到公共资源的合理分配,更是维护市场公平竞争的重要保障。政府采购合同公告制度正是为了满足这一需求而设立的。 1996-2024年政府采购合同公告明细数据(dta文…

Perl打印9x9乘法口诀

本章教程主要介绍如何用Perl打印9x9乘法口诀。 一、程序代码 1、写法① use strict; # 启用严格模式,帮助捕捉变量声明等错误 use warnings; # 启用警告,帮助发现潜在问题# 遍历 1 到 9 的数字 for my $i (1..9) {# 对于每个 $i,遍历 1…

Javascript 脚本查找B站限时免费番剧

目录 前言 脚本编写 脚本 前言 B站的一些番剧时不时会“限时免费”,白嫖党最爱,主打一个又占到便宜的快乐。但是在番剧索引里却没有搜索选项可以直接检索“限时免费”的番剧,只能自己一页一页的翻去查看,非常麻烦。 自己找限…

Git极速入门

git初始化 git -v git config --global user.name "" git config --global user.email "" git config --global credential.helper store git config --global --list省略(Local) 本地配置,只对本地仓库有效–global 全局配置,所有…

spring boot yml文件中引用*.properties文件中的属性

1、首先在*.properties文件中加入一个属性,如: 2、然后再application.yml文件中通过${jdbc.driver}来引用,如: 3、然后再创建一个资源配置类,通过PropertySource来引入这个*.properties文件,如&#xff1…

JDK中socket源码解析

目录 1、Java.net包 1. Socket通信相关类 2. URL和URI处理类 3. 网络地址和主机名解析类 4. 代理和认证相关类 5. 网络缓存和Cookie管理类 6. 其他网络相关工具类 2、什么是socket? 3、JDK中socket核心Api 4、核心源码 1、核心方法 2、本地方法 3、lin…

基于stm32的esp8266的WIFI控制风扇实验

实验案例WIFI控制风扇 项目需求 电脑通过esp8266模块远程遥控风扇。 项目框图 ​ 风扇模块封装 #include "sys.h" #include "fan.h"void fan_init(void) {GPIO_InitTypeDef gpio_initstruct;//打开时钟…

4K Mini-LED显示器平民价,一千多的联合创新27M3U到底有多香

哈喽小伙伴们好,我是Stark-C~ 要说前几年买显示器还是普通IPS的天下,那个时候虽说也有MiniLED或者OLED显示器,但是价格那也是真贵啊,毕竟那个时候MiniLED和OLED还没普及,只有一些高档电视或者显示器才会用到此技术。不…

OpenCV高级图形用户界面(18)手动设置轨迹条(Trackbar)的位置函数setTrackbarPos()的使用

操作系统:ubuntu22.04 OpenCV版本:OpenCV4.9 IDE:Visual Studio Code 编程语言:C11 算法描述 该函数设置指定窗口中指定轨迹条的位置。 注意 [仅 Qt 后端] 如果轨迹条附加到控制面板,则 winname 可以为空。 函数原型 void cv…

三周精通FastAPI:4 使用请求从客户端(例如浏览器)向 API 发送数据

FastAPI官网手册:https://fastapi.tiangolo.com/zh/tutorial/query-params/ 上节内容:三周精通FastAPI:3 查询参数 请求 FastAPI 使用请求从客户端(例如浏览器)向 API 发送数据。 请求是客户端发送给 API 的数据。响…

国家信息安全水平考试(NISP一级)最新题库-第十六章

目录 另外免费为大家准备了刷题小程序和docx文档,有需要的可以私信获取 1 防火墙是一种较早使用、实用性很强的网络安全防御技术,以下关于防火墙说法错误的是() A.防火墙阻挡对网络的非法访问和不安全数据的传递;B.防…

Leecode刷题之路第27天之移除元素

题目出处 27-移除元素-题目描述 题目描述 给你一个数组 nums 和一个值 val,你需要 原地 移除所有数值等于 val 的元素。元素的顺序可能发生改变。然后返回 nums 中与 val 不同的元素的数量。假设 nums 中不等于 val 的元素数量为 k,要通过此题&#x…

C++ | Leetcode C++题解之第491题非递减子序列

题目&#xff1a; 题解&#xff1a; class Solution { public:vector<int> temp; vector<vector<int>> ans;void dfs(int cur, int last, vector<int>& nums) {if (cur nums.size()) {if (temp.size() > 2) {ans.push_back(temp);}return;}if…

【题解】—— LeetCode一周小结42

&#x1f31f;欢迎来到 我的博客 —— 探索技术的无限可能&#xff01; &#x1f31f;博客的简介&#xff08;文章目录&#xff09; 【题解】—— 每日一道题目栏 上接&#xff1a;【题解】—— LeetCode一周小结41 14.鸡蛋掉落 题目链接&#xff1a;887. 鸡蛋掉落 给你 k 枚…

c++迷宫游戏

1、问题描述 程序开始运行时显示一个迷宫地图&#xff0c;迷宫中央有一只老鼠&#xff0c;迷宫的右下方有一个粮仓。游戏的任务是使用键盘上的方向健操纵老鼠在规定的时间内走到粮仓处。 基本要求: 老鼠形象可以辨认,可用键盘操纵老鼠上下左右移动&#xff1b;迷宫的墙足够结…

博弈论学习笔记【施工中】

SG函数 首先定义就不用我讲了吧&#xff0c;还不会的自己看看 传送门 再进一步理解一下吧&#xff1a; 黑色数字是节点编号&#xff0c;红色是 S G SG SG 函数值 看下它的过程&#xff1a; 首先 5 5 5 和 6 6 6 没有后继节点&#xff0c;为必败态&#xff0c;先赋值为 …

OpenCV和HALCON

OpenCV和HALCON是两种广泛用于图像处理和计算机视觉的开发库&#xff0c;它们各有优缺点&#xff0c;适合不同的应用场景。以下是两者的比较&#xff1a; 1. 开发背景与定位 OpenCV (Open Source Computer Vision Library)&#xff1a; 开源库&#xff0c;最初由Intel开发&…

【图解版】力扣第146题:LRU缓存

力扣第146题&#xff1a;LRU缓存 一、LRU算法1. 基本概念2. LRU 和 LFU 的区别&#xff1a;3. 为什么 LRU 不需要记录使用频率&#xff1f; 二、Golang代码实现三、代码图解1. LRUCache、DLinkedNode两个结构体2. 初始化结构体对象3. addToHead函数4. removeNode函数5. moveToH…

基于单片机的多功能鱼缸控制系统设计

本设计以STC12C5A60S2单片机为核心的多功能鱼缸控制系统&#xff0c;该系统可分别利用温度传感器、水位传感器和浑浊度传感器来检测鱼缸内部的水温、液体高度和浑浊程度&#xff0c;并在显示屏上进行显示。若检测结果超出阈值范围&#xff0c;则继电器工作从而控制内部环境。通…

LeetCode102. 二叉树的层序遍历(2024秋季每日一题 43)

给你二叉树的根节点 root &#xff0c;返回其节点值的 层序遍历 。 &#xff08;即逐层地&#xff0c;从左到右访问所有节点&#xff09;。 示例 1&#xff1a; 输入&#xff1a;root [3,9,20,null,null,15,7] 输出&#xff1a;[[3],[9,20],[15,7]] 示例 2&#xff1a; 输入…