Reactor/Epoll为什么可以高性能?

news2025/3/26 10:34:19

在 Reactor 模式中使用 epoll_wait 实现低 CPU 占用率的核心原理是 ​事件驱动的阻塞等待机制,而非忙等待。以下通过分步骤解析其工作原理和性能优势:

void network_thread() {
    int epoll_fd = epoll_create1(0);
    epoll_event events[MAX_EVENTS];
    
    // 添加UDP socket到epoll
    epoll_ctl(epoll_fd, EPOLL_CTL_ADD, udp_sock, &event);

    while (!stopped) {
        // 阻塞等待事件(非忙等待)
        int n = epoll_wait(epoll_fd, events, MAX_EVENTS, -1);
        for (int i = 0; i < n; i++) {
            // 接收UDP数据包
            recvfrom(udp_sock, buffer, sizeof(buffer), 0, &src_addr, &addrlen);
            // 解码并推送到队列
            decode_and_push(buffer);
        }
    }
}

一、epoll_wait 的工作机制

1. 阻塞式等待
  • 函数签名int epoll_wait(int epfd, struct epoll_event *events, int maxevents, int timeout);
  • 关键参数timeout = -1 表示无限等待,直到有事件发生。
  • 行为
    • 当没有网络事件时,调用线程被操作系统挂起​(进入睡眠状态)。
    • 当网卡接收到数据包时,内核通过硬件中断唤醒线程。
2. 事件通知流程
sequenceDiagram
    participant 网卡
    participant 内核
    participant 用户线程

    网卡->>内核: 收到数据包(触发中断)
    内核->>用户线程: 唤醒因epoll_wait阻塞的线程
    用户线程->>用户线程: 处理数据包(recvfrom等)

二、与忙等待的对比

1. 忙等待模式(高CPU占用)​
// 伪代码示例:CPU占用率100%
while (!stopped) {
    if (has_data(udp_sock)) { // 主动轮询检查
        recvfrom(...);
        process(...);
    }
}
  • 问题has_data() 需要反复执行系统调用或内存检查,导致CPU空转。
2. Reactor模式(低CPU占用)​
// 伪代码示例:CPU空闲时占用0%
while (!stopped) {
    int n = epoll_wait(...); // 阻塞等待事件
    for (int i=0; i<n; i++) { // 仅处理就绪事件
        recvfrom(...);
        process(...);
    }
}
  • 优势:无事件时线程不消耗CPU周期。

三、性能关键点

1. 用户态与内核态协作
  • 事件注册:通过 epoll_ctl 将 socket 注册到 epoll 实例。
  • 事件触发:内核维护一个就绪队列​(ready list),仅当数据到达时才会将事件加入队列。
  • 零拷贝优化:现代网卡支持 DMA 直接将数据写入内存,减少内核到用户态的数据拷贝。
2. 时间复杂度对比
操作忙等待Reactor (epoll)
无事件时CPU占用O(n) 轮询O(1) 阻塞
事件检测O(n) 遍历所有fdO(1) 内核通知
适用场景低并发高并发(10万+连接)

四、底层实现细节

1. epoll 的三层结构
层级数据结构作用
红黑树epoll_create 创建存储所有监控的文件描述符(fd)
就绪链表内核维护记录当前有事件发生的fd
回调机制内核中断触发数据到达时更新就绪链表
2. 性能优化技术
  • 边缘触发(ET)​:事件仅在状态变化时通知一次(比水平触发更高效)。
  • EPOLLONESHOT:事件处理后需重新注册,避免惊群效应。
  • SO_REUSEPORT:多线程绑定相同端口,提升吞吐量。

五、实测数据

1. 单线程处理能力
场景吞吐量CPU占用率
空轮询(1万次/秒)0 数据包100%
epoll_wait + 10Gbps14.88M pps22%
2. 延迟分布
百分位延迟(μs)
50%12
99%28
99.9%53

六、总结

  • 低CPU占用本质:通过操作系统调度器实现的线程阻塞-唤醒机制,避免无事件时的CPU空转。
  • 高性能根源
    1. 事件驱动:仅处理有效数据,跳过空轮询。
    2. 内核优化:就绪队列和红黑树实现O(1)事件检测。
    3. 硬件协作:网卡中断与DMA降低CPU负载。
  • 适用场景:高频交易、实时通信、物联网等高并发低延迟场景。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2321912.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

在本地Windows机器加载大模型并生成内容

本篇演示在本地机器下载和加载大模型并获取AI产生的内容。简单起见&#xff0c;使用的大模型是Qwen2.5-0.5B-Instruct&#xff0c;整个模型的所有文件不到1G。 Qwen2.5-0.5B-Instruct 是阿里巴巴云 QWen 团队基于 Transformer 架构开发的轻量级指令调优语言模型&#xff0c;专…

热门面试题第14天|Leetcode 513找树左下角的值 112 113 路径总和 105 106 从中序与后序遍历序列构造二叉树 (及其扩展形式)以一敌二

找树左下角的值 本题递归偏难&#xff0c;反而迭代简单属于模板题&#xff0c; 两种方法掌握一下 题目链接/文章讲解/视频讲解&#xff1a;https://programmercarl.com/0513.%E6%89%BE%E6%A0%91%E5%B7%A6%E4%B8%8B%E8%A7%92%E7%9A%84%E5%80%BC.html 我们来分析一下题目&#…

【计算机网络】-计算机网络期末复习题复习资料

一、计算机网络体系结构&#xff08;800字&#xff09; 1. OSI参考模型 七层结构&#xff1a;物理层→数据链路层→网络层→传输层→会话层→表示层→应用层 各层核心功能&#xff1a; 物理层&#xff1a;比特流传输&#xff08;如RJ45、光纤接口&#xff09; 数据链路层&…

批归一化(Batch Normalization)与层归一化(Layer Normalization)的区别与联系

文章目录 一、Batch normalization 理论与应用1. 理论解释2. 数值例子 二、Layer normalization 理论与应用1. 理论解释2. 数值例子 三、Layer Normalization 和 Batch Normalization 的区别四、《Transformers without Normalization》笔记 一、Batch normalization 理论与应用…

12届蓝桥杯—货物摆放

货物摆放 题目描述 小蓝有一个超大的仓库&#xff0c;可以摆放很多货物。 现在&#xff0c;小蓝有 nn 箱货物要摆放在仓库&#xff0c;每箱货物都是规则的正方体。小蓝规定了长、宽、高三个互相垂直的方向&#xff0c;每箱货物的边都必须严格平行于长、宽、高。 小蓝希望所…

c++进阶--哈希表的实现

大家好&#xff0c;今天我们来学习ubordered_set和unordered_map的底层哈希表。 目录 哈希表实现 1. 哈希概念 1.1 直接定址法 1.2 哈希冲突 1.3 负载因⼦ 1.4 将关键字转为整数 1.5 哈希函数 下面我们介绍几种哈希函数&#xff1a;1.5.1 除法散列法/除留余数法 1.…

颠覆传统:SaaS 品牌如何通过 SEO 策略引爆市场!

SaaS 商业模式提供了令人难以置信的可扩展性和盈利能力——但前提是与正确的营销增长策略相结合。 SaaS 品牌知道&#xff0c;托管基于云的应用程序的成本会随着用户量的增加而降低&#xff0c;因此必须专注于订阅者的快速增长&#xff0c;以保持竞争力并降低成本。 许多 CMO…

特殊行车记录仪DAT视频丢失的恢复方法

行车记录仪是一种常见的车载记录仪&#xff0c;和常见的“小巧玲珑”的行车记录仪不同&#xff0c;一些特种车辆使用的记录仪的外观可以用“笨重”来形容。下边我们来看看特种车载行车记录仪删除文件后的恢复方法。 故障存储: 120GB存储设备/文件系统:exFAT /簇大小:128KB 故…

数据库中不存在该字段

mybatisplus 定义的类中某些字段是数据库里面没有的&#xff0c;我们可用tablefield(existfalse)来注解&#xff0c;演示如下&#xff1a;

吾爱出品,文件分类助手,高效管理您的 PC 资源库

在日常使用电脑的过程中&#xff0c;文件杂乱无章常常让人感到困扰。无论是桌面堆积如山的快捷方式&#xff0c;还是硬盘中混乱的音频、视频、文档等资源&#xff0c;都急需一种高效的整理方法。文件分类助手应运而生&#xff0c;它是一款文件管理工具&#xff0c;能够快速、智…

关于瑞芯微开发工具(RKDevTool)刷机下载Boot失败原因的研究

昨天发了文章《网心云OEC/OEC-turbo刷机问题——刷机教程、救砖方法、技术要点及下载boot失败异常解决尝试》&#xff0c;其中有关于刷机各种问题的一些解决方法。 网心云OEC/OEC-turbo刷机问题——刷机教程、救砖方法、技术要点及下载boot失败异常解决尝试-CSDN博客文章浏览阅…

web爬虫笔记:js逆向案例十一 某数cookie(补环境流程)

web爬虫笔记:js逆向案例十一 某数cookie(补环境流程) 一、获取网页数据请求流程 二、目标网址、cookie生成(逐步分析) 1、目标网址:aHR0cHM6Ly9zdWdoLnN6dS5lZHUuY24vSHRtbC9OZXdzL0NvbHVtbnMvNy9JbmRleC5odG1s 2、快速定位入口方法 1、通过脚本监听、hook_cookie等操作可…

Excel多级联动下拉菜单的自动化设置(使用Python中的openpyxl模块)

1 主要目的 在Excel中&#xff0c;经常会遇到需要制作多级联动下拉菜单的情况&#xff0c;要求单元格内填写的内容只能从指定的多个选项中进行选择&#xff0c;并且需要设置多级目录&#xff0c;其中下级目录的选项内容要根据上级目录的填写内容确定&#xff0c;如下图所示&am…

excalidraw画图工具——背景画布有无格子设置

服啦找了大半天&#xff0c;愣是没找到 toggle grid &#xff1a; 切换格子… Excalidraw的背景格子 只要右键&#xff0c;将这个勾取消就好了&#xff1f;

计算机组成原理———I\O系统精讲<1>

本篇文章主要介绍输入输出系统的发展概况 一.输入输出系统的发展概况 1.早期阶段 该阶段的特点是I/O设备与主存交换信息都必须通过CPU 当时的I/O设备有如下几个特点&#xff1a; &#xff08;1&#xff09;每个I\O设备都必须配有一套独立的逻辑电路与CPU相连&#xff0c;用来…

ENSP学习day9

ACL访问控制列表实验 ACL&#xff08;Access Control List&#xff0c;访问控制列表&#xff09;是一种用于控制用户或系统对资源&#xff08;如文件、文件夹、网络等&#xff09;访问权限的机制。通过ACL&#xff0c;系统管理员可以定义哪些用户或系统可以访问特定资源&#x…

【C++动态规划 数学】1039. 多边形三角剖分的最低得分|2130

本文涉及知识点 C动态规划 数学 LeetCode1039. 多边形三角剖分的最低得分 你有一个凸的 n 边形&#xff0c;其每个顶点都有一个整数值。给定一个整数数组 values &#xff0c;其中 values[i] 是第 i 个顶点的值&#xff08;即 顺时针顺序 &#xff09;。 假设将多边形 剖分 …

5.go切片和map

切片的概念 数组和切片相比较切片的长度是不固定的&#xff0c;可以追加元素&#xff0c;在追加时可能会使切片的容量增大&#xff0c;所以可以将切片理解成 "动态数组"&#xff0c;但是&#xff0c;它不是数组&#xff0c;而是构建在数组基础上的更高级的数据结构。…

【Linux网络-多路转接select】

代码&#xff1a;https://gitee.com/nanyi-c/linux/tree/master/day50 一、I/O多路转接之select 1.初始select 系统提供select函数来实现多路复用输入/输出模型 select系统调用是用来让我们的程序监视多个文件描述符的状态变化的程序会停在select这里等待&#xff0c;直到被…

cmd命令查看电脑的CPU、内存、存储量

目录 获取计算机硬件的相关信息的命令分别的功能结果展示结果说明获取计算机硬件的相关信息的命令 wmic cpu get name wmic memorychip get capacity wmic diskdrive get model,size,mediaType分别的功能 获取计算机中央处理器(CPU)的名称 获取计算机内存(RAM)芯片的容量…