目录
前言
1.如何理解高效的IO
2.五种IO模型
3.非阻塞IO
4.非阻塞代码编写
总结
前言
哈喽,很高兴和大家见面!今天我们要介绍的关于IO的话题,在计算机中IO是非常常规的操作,例如将数据显示到外设,或者将数据从主机A发送到主机B……为了提高性能,减少IO的时间成为了一个人们比较关心的话题,而今天我们要介绍的是如何做才能提高IO效率。
1.如何理解高效的IO
IO:本质上是将数据从一方拷贝到另一方例如:调用read/recv读数据, 本质是将缓冲区的数据拷贝一份!但是拷贝数据的前提是要有数据,所以IO的过程包含两部分,一部分是等数据准备好,另一部分才是拷贝数据。因为拷贝数据的效率是由硬件本身决定的,所以要做到高效的IO,是要减少等的时间!
2.五种IO模型
举例说明:钓鱼的例子
张三坐在河边一动不动的等着鱼上钩
李四将鱼竿放在河边,然后就去做别的事情,然后隔一段时间看看有没有鱼上钩
五在鱼竿上放一个铃铛,将鱼竿放在河边,然后就去做别的事情,等铃铛响了就说明有鱼上钩了,然后把鱼钓上来
赵六带了一群鱼竿,然后都放在河边,然后就轮询的查看是否有鱼上钩
田七:找了一个人小刘,帮他钓鱼,等鱼钓上来,小刘通知田七,然后让田七把鱼拿走
其中张三对应于阻塞式IO
李四对应非阻塞式IO
王五对应信号驱动式IO
赵六对应多路转接/多路复用IO
田七对应异步IO
其中张三,李四,王五在效率上并没有什么差别!从整齐上来看李四和王五在钓鱼期间可以做其它的事情
信号驱动式IO:虽然是等信号发送了之后才会去拷贝数据,但是本质上也是等了!
四种方式,每个人都等了钓鱼->属于同步IO
第五种方式,没有参与IO阶段中任何阶段->属于异步IO
对于阻塞式IO和非阻塞式IO的差别:
相同点:都会进行数据拷贝
不同点:等的方式不同
阻塞式IO模型:
在内核将数据准备好之前, 系统调用会一直等待. 所有的套接字, 默认都是阻塞方式
非阻塞式IO模型:
如果内核还未将数据准备好, 系统调用仍然会直接返回, 并且返回EWOULDBLOCK错误码.
非阻塞IO往往需要程序员循环的方式反复尝试读写文件描述符, 这个过程称为轮询. 这对CPU来说是较大的浪费, 一般只有特定场景下才使用.
信号驱动式IO模型:
内核将数据准备好的时候, 使用SIGIO信号通知应用程序进行IO操作
IO多路转接模型:
虽然从流程图上看起来和阻塞IO类似. 实际上最核心在于IO多路转接能够同时等待多个文件
描述符的就绪状态.
异步IO:
由内核在数据拷贝完成时, 通知应用程序(而信号驱动是告诉应用程序何时可以开始拷贝数据).
小结
任何IO过程中, 都包含两个步骤. 第一是等待, 第二是拷贝. 而且在实际的应用场景中, 等待消耗的时间往往都远远高于拷贝的时间. 让IO更高效, 最核心的办法就是让等待的时间尽量少.
3.非阻塞IO
一个文件描述符, 默认都是阻塞IO.
fcntl()函数原型如下.
#include <unistd.h>
#include <fcntl.h>
int fcntl(int fd, int cmd, ... /* arg */ );
传入的cmd的值不同, 后面追加的参数也不相同.
fcntl函数有5种功能:
复制一个现有的描述符(cmd=F_DUPFD).
获得/设置文件描述符标记(cmd=F_GETFD或F_SETFD).
获得/设置文件状态标记(cmd=F_GETFL或F_SETFL).
获得/设置异步I/O所有权(cmd=F_GETOWN或F_SETOWN).
获得/设置记录锁(cmd=F_GETLK,F_SETLK或F_SETLKW).
我们此处只是用第三种功能, 获取/设置文件状态标记, 就可以将一个文件描述符设置为非阻塞
实现函数SetNoBlock
基于fcntl, 我们实现一个SetNoBlock函数, 将文件描述符设置为非阻塞.
void SetNoBlock(int fd) {
int fl = fcntl(fd, F_GETFL);
if (fl < 0) {
perror("fcntl");
return;
}
fcntl(fd, F_SETFL, fl | O_NONBLOCK);
}
使用F_GETFL将当前的文件描述符的属性取出来(这是一个位图).
然后再使用F_SETFL将文件描述符设置回去. 设置回去的同时, 加上一个O_NONBLOCK参数.
4.非阻塞代码编写
说明:用户向缓冲区输入数据,然后将数据读出来打印到显示器,显示器本质上也是一个文件,对应的文件描述符为0,此时将0号文件描述符对应的文件设置为非阻塞,当有数据的时候读取数据,没有数据的时候可以处理其它的业务,而不是阻塞式等待。
main.cc
#include"util.hpp"
#include<functional>
#include<vector>
using func_t = std::function<void()>;
#define INIT(v) do {\
v.push_back(PrintLog);\
v.push_back(Download);\
}while(0)
#define callback(cal) do{\
for(auto& e: cal) e();\
}while(0);
int main()
{
std::vector<func_t> cbs;
INIT(cbs);
setNoBlock(0);
while(true) {
char buf[1024];
printf(">>> ");
fflush(stdout);
int ret = read(0,buf,sizeof(buf)-1);
if(ret == 0) {
std::cout<< "read end" << std::endl;
break;
}
else if(ret > 0){
buf[ret-1] = 0;
std::cout << "echo# " << buf << std::endl;
}
else {
//不输入的时候,底层没有数据,不算错误,只不过是以错误的形式返回了
//如何区分是真的错了还是没有数据
//EAGAIN 和 EWOULDBLOCK 都表示没有数据
if(errno == EAGAIN || errno == EWOULDBLOCK) {
std::cout << "没有数据" << std::endl;
callback(cbs);
}
else if(errno == EINTR) continue;
else {
//真的错了
std::cout << ret << "errno: "<< strerror(errno) << std::endl;
break;
}
}
sleep(1);
}
return 0;
}
util.hpp:
#include<iostream>
#include<cstring>
#include<errno.h>
#include<unistd.h>
#include<fcntl.h>
void setNoBlock(int fd) {
int f1 = fcntl(fd,F_GETFL);
if(f1 < 0) std::cerr<< "fcntl fail: " << strerror(errno) << std::endl;
fcntl(fd,F_SETFL,f1 | O_NONBLOCK);
}
void PrintLog() {
std::cout << "this is a LOG" << std::endl;
}
void Download() {
std::cout << "this is a Download" << std::endl;
}
运行截图:
总结
相信看完这篇文章之后,你一定可以理解要想实现高效的IO,必须要减少等的时间,如何减少等的时间呢?关于这个话题,一般采用IO多路转接的方案,IO多路转接包含select模型,poll模型,epoll模型,关于这三种模型,在后续的文章中为大家一一介绍,感谢大家的阅读,今天我们介绍的内容就结束了。