高性能 IO 模型:为什么单线程 Redis 能那么快?
- Redis 是单线程,主要是指 Redis 的网络 IO 和键值对读写是由一个线程来完成的,这也是 Redis 对外提供键值存储服务的主要流程。但 Redis 的其他功能,比如持久化、异步删除、集群数据同步等,其实是由额外的线程执行的。
Redis 为什么用单线程?
多线程的开销
- 我们刚开始增加线程数时,系统吞吐率会增加,但是,再进一步增加线程时,系统吞吐率就增长迟缓了,有时甚至还会出现下降的情况。
- 一个关键的瓶颈在于,系统中通常会存在被多线程同时访问的共享资源,比如一个共享的数据结构。当有多个线程要修改这个共享资源时,为了保证共享资源的正确性,就需要有额外的机制进行保证,而这个额外的机制,就会带来额外的开销。这就是多线程编程模式面临的共享资源的并发访问控制问题。
单线程 Redis 为什么那么快?
- 一方面,Redis 的大部分操作在内存上完成,再加上它采用了高效的数据结构,例如哈希表和跳表,这是它实现高性能的一个重要原因。另一方面,就是 Redis 采用了多路复用机制,使其在网络 IO 操作中能并发处理大量的客户端请求,实现高吞吐率。
- 非阻塞模式
- Socket 网络模型的非阻塞模式设置,主要体现在三个关键的函数调用上。
- 在 socket 模型中,不同操作调用后会返回不同的套接字类型。
- socket() 方法会返回主动套接字,然后调用 listen() 方法,将主动套接字转化为监听套接字,此时,可以监听来自客户端的连接请求。
- 最后,调用 accept() 方法接收到达的客户端连接,并返回已连接套接字。
- 基于多路复用的高性能 I/O 模型
- Linux中的 IO 多路复用机制是指一个线程处理多个 IO 流,即 select/epoll 机制。
- 在 Redis 只运行单线程的情况下,该机制允许内核中,同时存在多个监听套接字和已连接套接字。
- 内核会一直监听这些套接字上的连接请求或数据请求。
- 一旦有请求到达,就会交给 Redis 线程处理,这就实现了一个 Redis 线程处理多个 IO 流的效果。
- 为了在请求到达时能通知到 Redis 线程,select/epoll 提供了基于事件的回调机制,即针对不同事件的发生,调用相应的处理函数。
- Socket 网络模型的非阻塞模式设置,主要体现在三个关键的函数调用上。