前言
在面试的时候遇到Redis肯定会问,Redis单线程为什么那么快呀?你可以说下你对IO多路复用的机制嘛。但是仔细一想Redis真的是单线程在运行处理嘛,其实这个单线程主要指的Redis的网络IO和键值对读写是由一个线程来完成的,Redis在处理客户端的请求,包括socket读取、解析、执行、写入socket都由一个顺序串行的主线程处理。但是其他的流程比如说持久化AOF、RDB、集群数据同步等都有别的线程完成。
Redis命令工作线程是单线程的,但是,整个Redis来说,是多线程的;
Redis为什么用单线程
多线程的开销
程序设计中,一般为了充分利用操作系统底层资源,都需要进行设计多线程编程,但是无脑的使用多线程编程,并不会得到一直较高的系统吞吐率。因为多线程之间存在系统资源的竞争,如果不能合理的设计对共享资源的访问,那么就可能出现串行执行的结果。
在并发编程领域来说,共享资源竞争问题是必须面对的问题,否则处理不好,可能会导致数据出现紊乱。比如同时操作key1,A线程修改为1,B线程修改为2。如何保证同一时间只有一个线程在处理。并且我们需要维护对共享资源的互斥关系,在程序设计需要去考虑这些问题,因此Redis采用单线程。
单线程为什么快?
一是由于本身在内存中操作,并且利用高效的数据结构哈希表,跳表等。二是由于利用了IO多路服用机制来实现在网络IO中可以并发处理大量的客户端请求。
基本IO模型与阻塞点
如果我们操作的是简单的get key1操作,全流程就是首先监听客户端的请求(bind/listen)、Accept(建立连接)、recv(从socket获取数据)、parse(解析数据)、获取数据之后get,最后发送数据写入socket中。
但是图中,在accept建立连接和recv\send过程可能出现连接建立被阻塞,或者从socket中获取不到数据。
非阻塞模式
在Socket模型中,不同的操作会返回不同的套接字类型,socket()会返回套接字,接着调用listen()返回监听套接字,然后调用accept()返回已连接套接字。
当我们调用accept()套接字,如果一直没有请求建立连接,那么不会一直等待,而是返回去操作其他请求。
IO多路复用模型
IO多路复用是指一个线程可以处理多个IO流,Redis在单线程运行的情况下,可以同时监听多个套接字和已连接套接字,一旦有请求到达,Redis线程就可以处理。
FD就是多个套接字,
上述流程一个线程进行监听套接字,当有对应的套接字发生时,出发对应的事件写入到对应的事件队列中,然后通过对应的事件回调函数进行处理。
但是这里其实也设计到了网络编程中的模型,以及对应的同步、异步、阻塞、非阻塞
BIO、NIO、IO多路复用,对应的select、poll、epoll等由于涉及的东西比较多,这个我在下一篇文章中具体解释下。
小结
本篇主要介绍了Redis为什么执行快,已经引入多线程的存在的问题。最后引入IO多路复用机制。