目录
一、poll原理
二、poll实现多路转接IO服务器
三、epoll函数接口
四、epoll的工作原理
五、epoll实现多路转接IO服务器
一、poll原理
poll函数接口
#include <poll.h>
int poll(struct pollfd *fds, nfds_t nfds, int timeout);
// pollfd结构
struct pollfd
{
int fd; /* file descriptor */
short events; /* requested events */
short revents; /* returned events */
}
- fds是一个poll函数监听的结构列表,每一个元素,包含了三部分内容:文件描述符、监听事件的集合、返回的事件集合
- nfds表示fds数组的长度
- timeout表示poll函数的超时时间,单位是毫秒:①timeout > 0 ,timeout时间以内阻塞等待,否则非阻塞返回一次;②timeout == 0,非阻塞等待;③timeout < 0,阻塞等待
事件 | 描述 | 是否可作为输入 | 是否可作为输出 |
POLLIN | 数据(普通数据、优先数据)可读 | 是 | 是 |
POLLRDNORM | 普通数据可读 | 是 | 是 |
POLLRDBAND | 优先级带数据可读(Linux不支持) | 是 | 是 |
POLLPRI | 高优先级数据可读,如TCP带外数据 | 是 | 是 |
POLLOUT | 数据(普通数据、优先数据)可写 | 是 | 是 |
POLLWRNORM | 普通数据可写 | 是 | 是 |
POLLWRBAND | 优先级带数据可写 | 是 | 是 |
POLLRDHUP | TCP连续被对方关闭或对方关闭了写操作,它由GNU引入 | 否 | 是 |
POLLERR | 错误 | 否 | 是 |
POLLHUP | 挂起。比如通道的写端被关闭后,读端描述符上将收到POLLHUP事件 | 否 | 是 |
POLLVNAL | 文件描述符没有打开 | 否 | 是 |
- 返回值小于0,表示出错
- 返回值等于0,表示poll函数等待超时
- 返回值大于0,表示poll用于监听的文件描述符就绪而返回
poll的优点
poll多路转接的提出是为了解决select存在的部分缺陷,不同于select使用三个位图结构来表示三个fd_set的方式,poll使用一个pollfd的指针实现:
- pollfd结构包含了要监视的event和发生的event,不再使用select“参数-值”传递的方式,接口使用比select方便,不需要每次调用都重新设置需要关心的fd
- events参数:用户告诉内核你需要帮我监视哪些fd
- revents参数:内核告诉用户哪些正在监视的fd已经就绪了
- poll并没有最大数量限制(但是最大数量限制是由系统能接受的最大数量决定,监视的fd数量过大时性能也会下降)
poll的缺点
poll中监听的文件描述符增多时:
- 和select一样,poll返回后,需要轮询所有pollfd来获取就绪的描述符
- 每次调用poll都需要把大把的pollfd结构从用户态拷贝到内核中
- 同时连接的大量客户端在一时刻可能只有很少的处于就绪状态,因此随着监听的文件描述符数量的增长,其效率也会线性下降
二、poll实现多路转接IO服务器
Log.hpp、Sock.hpp、main.cc与select中的多路转接是一样的:【Linux后端服务器开发】select多路转接IO服务器_命运on-9的博客-CSDN博客
PollServer.hpp
#pragma once
#include <iostream>
#include <string>
#include <functional>
#include <poll.h>
#include "Sock.hpp"
using namespace std;
static const int g_defaultport = 8080;
static const int g_num = 2024;
static const int g_defaultfd = -1;
using func_t = function<string (const string&)>;
class PollServer
{
public:
PollServer(func_t f, int port = g_defaultport)
: _func(f), _port(port), _listensock(-1), _rfds(nullptr)
{}
void Init()
{
_listensock = Sock::Socket();
Sock::Bind(_listensock, _port);
Sock::Listen(_listensock);
_rfds = new struct pollfd[g_num];
for (int i = 0; i < g_num; ++i)
Reset_Item(i);
_rfds[0].fd = _listensock;
_rfds[0].events = POLLIN;
}
void Reset_Item(int i)
{
_rfds[i].fd = g_defaultfd;
_rfds[i].events = 0;
_rfds[i].revents = 0;
}
void Print_Rfds()
{
cout << "rfd list: ";
for (int i = 0; i < g_num; ++i)
if (_rfds[i].fd != g_defaultfd)
cout << _rfds[i].fd << " ";
cout << endl;
}
void Accepter(int listensock)
{
Log_Message(DEBUG, "Accepter in");
string clientip;
uint16_t clientport = 0;
int sock = Sock::Accept(listensock, &clientip, &clientport);
if (sock < 0)
return;
Log_Message(NORMAL, "accept success [%s: %d]", clientip.c_str(), clientport);
int i = 0;
for (; i < g_num; ++i)
{
if (_rfds[i].fd != g_defaultfd)
continue;
else
break;
}
if (i == g_num)
{
Log_Message(WARNING, "server is full, please wait");
close(sock);
}
else
{
_rfds[i].fd = sock;
_rfds[i].events = POLLIN;
_rfds[i].revents = 0;
}
Print_Rfds();
Log_Message(DEBUG, "Accepter out");
}
void Recver(int pos)
{
Log_Message(DEBUG, "in Recver");
// 1. 读取request
char buffer[1024];
ssize_t s = recv(_rfds[pos].fd, buffer, sizeof(buffer) - 1, 0);
if (s > 0)
{
buffer[s] = 0;
Log_Message(NORMAL, "client# %s", buffer);
}
else if (s == 0)
{
close(_rfds[pos].fd);
Reset_Item(pos);
Log_Message(NORMAL, "client quit");
return;
}
else
{
close(_rfds[pos].fd);
Reset_Item(pos);
Log_Message(ERROR, "client quit: %s", strerror(errno));
return;
}
// 2. 处理request
string response = _func(buffer);
// 3. 返回response
write(_rfds[pos].fd, response.c_str(), response.size());
Log_Message(DEBUG, "out Recver");
}
void Handler_Read_Event()
{
for (int i = 0; i < g_num; ++i)
{
// 过滤掉非法的fd
if (_rfds[i].fd == g_defaultfd)
continue;
if (!(_rfds[i].events & POLLIN))
continue;
if (_rfds[i].fd == _listensock && (_rfds[i].revents & POLLIN))
Accepter(_listensock);
else if (_rfds[i].revents & POLLIN)
Recver(i);
}
}
void Start()
{
int timeout = -1;
while (1)
{
int n = poll(_rfds, g_num, timeout);
switch (n)
{
case 0:
Log_Message(NORMAL, "timeout ...");
break;
case -1:
Log_Message(WARNING, "poll error, code:%d, err string: %s", errno, strerror(errno));
break;
default:
Log_Message(NORMAL, "have event ready!");
Handler_Read_Event();
break;
}
}
}
~PollServer()
{
if (_listensock < 0)
close(_listensock);
if (_rfds)
delete[] _rfds;
}
private:
int _port;
int _listensock;
struct pollfd* _rfds;
func_t _func;
};
三、epoll函数接口
epoll的官方说法是为了处理大批量句柄而做了改进的poll,但是在底层原理的设计上,epoll与poll有着天差地别的区别(老婆与老婆饼的关系),epoll的设计远远优于poll。
它是在2.5.44内核中被引进的(epoll(4) is a new API introduced in Linux kernel 2.5.44),几乎弥补了前两种多路转接接口(select、poll)的所有缺陷,被公认为Linux2.6之后性能最好的多路I/O就绪通知方法。
epoll_create
int epoll_create(int size);
创建一个epoll模型,自从2.6.8之后size参数是被忽略的,用完之后必须调用close关闭。
epoll_ctl
int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event);
epoll的事件注册函数,它不同于select()是在监听事件时告诉内核要监听什么类型的事件,而是在这里先注册要监听的事件类型。
第一个参数是epoll_create()的返回值(epoll模型),第二个参数表示动作(用三个宏表示),第三个参数是需要监听的fd,第四个参数是告诉内核需要监听什么事。
第二个参数的取值:①EPOLL_CTL_ADD,注册新的fd到epfd中;②EPOLL_CTL_MOD,修改已经注册的fd监听事件;③EPOLL_CTL_DEL,从epfd中删除一个fd。
epoll_wait
int epoll_wait(int epfd, struct epoll_event * events, int maxevents, int timeout);
收集在epoll监听的事件中已经发生的事件:
- 参数events是分配好的epoll_event结构体
- epoll将会把发生的事件赋值到events数组中(events不可以是空指针,内核只负责把数据复制到这个events数组中,不会去帮助我们在用户态中分配内存)
- maxevents参数是告知内核这个events多大,这个maxevents的值不能大于创建的epoll_create()时的size
- 参数timeout是超时时间(ms,0会立即返回,-1是阻塞等待)
- 如果函数调用成功,返回I/O已经准备好的文件描述符数目,如返回0表示已超时,返回值小于0表示报错
struct epoll_event结构
typedef union epoll_data
{
void *ptr;
int fd;
uint32_t u32;
uint64_t u64;
} epoll_data_t;
struct epoll_event
{
uint32_t events; /* Epoll events */
epoll_data_t data; /* User data variable */
} __EPOLL_PACKED;
events可以是以下几个宏的集合:
- EPOLLIN:表示对应的文件描述符可以读(包括对端socket的正常关闭)
- EPOLLOUT:表示对应的文件描述符可以写
- EPOLLPRI:表示对应的文件描述符有紧急的数据可读(表示有外带数据到来)
- EPOLLERR:表示对应的文件描述符发生错误
- EPOLLHUP:表示对应的文件描述符被挂掉
- EPOLLET:将EPOLL设为边缘触发(Edge Triggered)模式,这是相对于水平触发(Level Triggered)来说的
- EPOLLONESHOP:只监听一次事件,当监听完这次事件后,如果如果还需要继续监听这个socket的话,需要再次把这个socket加入到EPOLL队列里
四、epoll的工作原理
- 通过epoll_create()创建epoll模型
- 通过epoll_ctl()将需要监视的文件描述符告诉OS,由OS维护红黑树进行监视
- 当数据从硬件层传入网卡驱动再写入操作系统中监视的文件缓冲区,会通过每个文件的回调机制将受监视的fd节点传入就绪队列中
- 上层直接对就绪队列进行事件处理,而不用对所有监视进行遍历
什么是事件就绪?底层的IO条件满足了,可以进行某种IO行为了,即事件就绪。
select / poll / epoll ----> IO事件的通知机制(等)
事件的通知有什么策略呢?LT工作模式和ET工作模式
关于事件的通知,这里有一个取快递的示例:
假设你网购了一些东西,快递到了,这时快递员张三就把快递送到你家楼下,打电话通知你让你下去取快递,你不下去他就一直给你打,直到你去将你的所有快递取完了他才离开。
之后你又网购了一些东西,快递到了,这时换了一个快递员变成李四了,他也将快递送到了你家楼下,但是他不会一直给你打电话,只要你接了电话他就离开了,也不管你有没有下来取快递。
这两种不同的通知策略,对应的就是LT水平触发模式和ET边缘触发模式,张三是LT,李四是ET。
epoll如何进行事件通知呢?通过文件的回调机制将红黑树中的就绪节点添加到就绪队列中
- LT水平触发:只要就绪队列中的数据没有处理完,epoll就会一直通知用户
- ET边缘触发:只要epoll将数据放入就绪队列里了,无论用户有没有将就绪队列里的数据读完,epoll就不再通知用户,除非底层的数据变化(数据增多),才会再次进行通知
epoll默认的是LT工作模式,我们也可以设置events将其改为ET模式。
为什么ET模式必须是非阻塞读取呢?
ET模式 ---> 底层只有数据从无到有、从有到多变化的时候,才会进行通知上层 ---> 只会通知一次 ---> 倒逼程序员将本轮就绪的数据全部读取完 ---> 你怎么知道你把就绪的数据全部读取完毕了呢?循环读取,直到读取不到数据了 ---> 一般的fd,是阻塞式读取,但是ET模式下,必须是非阻塞读取,防止最后一次因读取不到数据而阻塞
为什么ET模式更高效?因为ET高效不仅体现在通知机制上,还会倒逼程序一次把就绪数据读取完,TCP通信时让接收方可以给发送方提供一个更大的窗口大小,即让对端更新出一个更大的滑动窗口,提高网络通信的数据吞吐量。
所以TCP中PSH标志的作用?让底层就绪事件,再次通知给上层。
五、epoll实现多路转接IO服务器
Log.hpp、Sock.hpp、main.cc与poll版本的一样
EpollServer.hpp
#pragma once
#include <iostream>
#include <string>
#include <cstring>
#include <functional>
#include <sys/epoll.h>
#include "Sock.hpp"
using namespace std;
static const int g_defaultport = 8080;
static const int g_size = 2024;
static const int g_defaultvalue = -1;
static const int g_defaultnum = 64;
using func_t = function<string (const string&)>;
class EpollServer
{
public:
EpollServer(func_t f, uint16_t port = g_defaultport, int num = g_defaultnum)
: _func(f), _num(num), _revs(nullptr), _port(port), _listensock(g_defaultvalue), _epfd(g_defaultvalue)
{}
void Init()
{
// 1. 创建socket
_listensock = Sock::Socket();
Sock::Bind(_listensock, _port);
Sock::Listen(_listensock);
// 2. 创建epoll模型
_epfd = epoll_create(g_size);
if (_epfd < 0)
{
Log_Message(FATAL, "epoll create error: %s", strerror(errno));
exit(EPOLL_CREATE_ERR);
}
// 3. 添加listensock到epoll中
struct epoll_event ev;
ev.events = EPOLLIN;
ev.data.fd = _listensock;
epoll_ctl(_epfd, EPOLL_CTL_ADD, _listensock, &ev);
// 4. 申请就绪事件的空间
_revs = new struct epoll_event[_num];
Log_Message(NORMAL, "init server success");
}
void Handler_Event(int ready_num)
{
Log_Message(DEBUG, "Handler_Event in");
// 遍历就绪队列
for (int i = 0; i < ready_num; ++i)
{
uint32_t events = _revs[i].events;
int sock = _revs[i].data.fd;
if (sock == _listensock && (events & EPOLLIN))
{
// _listensock事件就绪,建立新连接
string clientip;
uint16_t clientport;
int fd = Sock::Accept(sock, &clientip, &clientport);
if (fd < 0)
{
Log_Message(WARNING, "accept error");
continue;
}
// 获取fd成功,可以直接读取吗?不可以,放入epoll
struct epoll_event ev;
ev.events = EPOLLIN;
ev.data.fd = fd;
epoll_ctl(_epfd, EPOLL_CTL_ADD, fd, &ev);
}
else if (events & EPOLLIN)
{
// 普通事件就绪
char buffer[1024];
int n = recv(sock, buffer, sizeof(buffer), 0);
if (n > 0)
{
buffer[n] = 0;
Log_Message(NORMAL, "client say# %s", buffer);
// TODO
string response = response = _func(buffer);
send(sock, response.c_str(), response.size(), 0);
}
else if (n == 0)
{
// 先从epoll移除,再close fd
epoll_ctl(_epfd, EPOLL_CTL_DEL, sock, nullptr);
close(sock);
Log_Message(NORMAL, "client quit");
}
else
{
epoll_ctl(_epfd, EPOLL_CTL_DEL, sock, nullptr);
close(sock);
Log_Message(ERROR, "recv error, code: %d, errstring: %s", errno, strerror(errno));
}
}
}
Log_Message(DEBUG, "Handler_Event out");
}
void Start()
{
int timeout = -1;
while (1)
{
int n = epoll_wait(_epfd, _revs, _num, timeout);
switch (n)
{
case 0:
Log_Message(NORMAL, "timeout ...");
break;
case -1:
Log_Message(WARNING, "epoll_wait failed, code: %d, err string: %s", errno, strerror(errno));
break;
default:
Log_Message(NORMAL, "have event ready");
Handler_Event(n);
break;
}
}
}
private:
uint16_t _port;
int _listensock;
int _epfd; // epoll模型
struct epoll_event* _revs; // 就绪队列
int _num;
func_t _func;
};