IO多路复用的概念
IO多路复用其实一听感觉很高大上,但是如果细细的拆分以下,
IO:网络IO,操作系统层面指数据在内核态和用户态之间的读写操作。
多路:多个客户端连接(连接就是套接字描述符,即Socket)
复用:用一个或多个连接处理
其实就是用一个服务端连接进行处理多客户端的请求。实际就是一个服务端进程处理多个套接字描述符,实现返回有select、poll、epoll。
那么什么是文件描述符呢?
说白了就是非负整数,当打开或者创建一个文件描述符时返回一个数值。
整个流程是什么样的?
当用户有请求进来之后,会将用户socket文件描述符注册进入epoll,然后epoll监听哪些socket有消息到达。可以避免Redis主线程来回进行切换或者被阻塞。通过一个主线程来控制请求数据量的转发。
为什么这样的方式吞吐量比较高呢,其实如果是来一个请求创建一个线程,那么太耗费资源,但是如果一个线程轮询处理,那么可能会被阻塞导致吞吐量较低。
通信方式
同步:调用者需要等待下游系统的结果,线程一直会在等待中。比如订单系统调用支付系统,需要支付系统返回结果才可以进行后续的订单状态修改。处理时间比较快的系统推荐使用。
异步:调用者接受到被调用者的相应,就处理别的事情,一般需要被调用者通过回调函数或者异步MQ的返回方式将结果写回,这种方式对于处理比较耗时的系统来说,一般采用异步方式。
阻塞:调用方会被阻塞,一直什么不干。
非阻塞:调用方不会阻塞,先返回做别的事情。
同步异步:在于被调用方返回消息的通知方式上
阻塞非阻塞:在于调用方等待时候的行为
五种网络编程的IO模型
Blocking IO: 阻塞IO
NoneBlocking IO : 非阻塞IO
IO multiplexing : IO多路复用
singal driven Io 信用驱动IO
saynchronuns 异步IO
BIO
服务端Code
public static void main(String[] args) throws IOException {
byte [] bytes = new byte[1024];
ServerSocket serverSocket = new ServerSocket(6379);
while (true) {
System.out.println("1.建立连接");
Socket accept = serverSocket.accept();
System.out.println("2.连接成功");
InputStream inputStream = accept.getInputStream();
int length = -1;
System.out.println("3.等待读取数据");
while ((length =inputStream.read(bytes)) != -1) {
System.out.println("4.读取到数据");
System.out.println(new String(bytes));
}
System.out.println("5.数据读取结束");
inputStream.close();
accept.close();
System.out.println("6.关闭资源结束");
}
}
客户端
public static void main(String[] args) throws IOException {
Socket socket = new Socket("127.0.0.1",6379);
OutputStream outputStream = socket.getOutputStream();
while (true) {
Scanner scanner = new Scanner(System.in);
String next = scanner.next();
if (next.equalsIgnoreCase("quit")) {
break;
}
outputStream.write(next.getBytes());
System.out.println("写入数据成功");
outputStream.close();
socket.close();
}
}
可以发现如果服务端采用建立连接之后,客户端迟迟不写入数据,那么客户端就会一直阻塞在read()中。
那么这种问题如何解决呢,一般简单的就是使用创建多个线程的方式来解决read阻塞问题。
public static void main(String[] args) throws IOException {
byte [] bytes = new byte[1024];
ServerSocket serverSocket = new ServerSocket(6379);
while (true) {
System.out.println("1.建立连接");
Socket accept = serverSocket.accept();
System.out.println("2.连接成功");
//多个线程处理read数据读取
new Thread(()-> {
InputStream inputStream = null;
try {
inputStream = accept.getInputStream();
int length = -1;
System.out.println("3.等待读取数据");
while ((length =inputStream.read(bytes)) != -1) {
System.out.println("4.读取到数据");
System.out.println(new String(bytes));
}
System.out.println("5.数据读取结束");
inputStream.close();
accept.close();
System.out.println("6.关闭资源结束");
} catch (IOException e) {
e.printStackTrace();
}
}).start();
}
}
但是如果细心的同学就会发现,其实如果大量的创建线程,会十分消耗系统资源,并且进程内创建线程是有一定的上限,所以解决办法要么使用线程池进行复用,要么使用非read阻塞模式,也就是NIO。
NIO
通过上面分析可以知道,其实BIO主要是在read过程中读取数据会被阻塞,而NIO通过轮询的方式不断查询数据,但是这样其实也会频繁的空跑CPU。
public static void main(String[] args) throws IOException {
Socket socket = new Socket("127.0.0.1",6379);
OutputStream outputStream = socket.getOutputStream();
while (true) {
Scanner scanner = new Scanner(System.in);
String next = scanner.next();
if (next.equalsIgnoreCase("quit")) {
break;
}
outputStream.write(next.getBytes());
System.out.println("写入数据成功");
outputStream.close();
socket.close();
}
}
Reactor模式
Reactor模式其实就是将请求处理和分发进行职责划分,一个线程负责请求的转发,而具体的业务逻辑由不同的处理现场进行处理。
select
可以看到select监听的文件描述符包括三个readfds、writefds、exceptfds,将用户传入的数组拷贝到内核空间,select会被阻塞,直到描述符就绪,返回。
selcet核心执行流程
1.select是一个阻塞函数,当没有数据时,会一直阻塞在select。
2.当有数据时,会将对应的rset设置为1
3.select函数返回,不在阻塞。遍历文件描述符判断那个fd置位,读取数据,然后处理。
优点 :说白了select的核心其实还是将用户态的轮询搬到了内核态,这样可以避免频繁的上下文切换,执行时间和效率上肯定更快。
缺点:
1.rset位不可重复用,每次socket有数据就会相应的位被置位。
2.bitmap 最大1024 一个进程最多处理1024个客户端。
3.文件描述符数组拷贝到了内核态,select调用需要传入fd数组,需要拷贝一份到内核,高并发场景下消耗的资源是惊人的。
4.select 没有通知用户态哪一个socket有数据,需要O(N)遍历。
小结:select方式,既做到了一个线程处理多个客户端连接(文件描述符),又减少了系统调用的开销(多个文件描述符只有一次 select 的系统调用 + N次就绪状态的文件描述符的 read 系统调用
poll
执行流程
优点
1.使用数组来解决select的bitmap 1024限制。
2.有事件发生时,将对应的revents置位位为1,遍历的时候将对应的位置设置为0,可以实现重用。
缺点
1.poll fds数组拷贝到内核态,仍然有开销。
2.poll并没有通知用户态那个socket有数据,需要O(N)遍历
epoll
1.epoll_create : 创建一个epoll 句柄
2.epoll_ctl 向内核添加、修改或删除要监听的文件描述符
3.epoll_wait 类似发起select调用
总结:IO多路复用快的原因在于,本身是用户态到内核态的多次数据调用,进一步优化成一次用户态+内核层遍历文件描述符。
小结
本篇主要介绍了IO多路复用的机制,从IO模型,通信方式(同步、异步),调用方是否等待(阻塞、非阻塞) ,以及介绍了三种主要的IO模型(BIO、NIO、IO多路复用机制)
而IO多路复用机制是很多中间件核心原理,比如Nginx、Redis等。具体就是三种不同的内置函数,select、poll、epoll,核心就是原来在用户态的while(true)多次调用,调整到内核态的一次系统调用+内核层遍历文件描述符。