Linux设备的I/O模型

news2025/1/24 17:41:37

背景:

进程休眠和唤醒

为了把一个进程设置为睡眠状态,需要把这个进程从TASK_RUNNING(可运行状态或就绪态)状态设置为TASK_INTERRUPTIBLE(浅度睡眠)或TASK_NUINTERRUPTIBLE(深度睡眠)状态,并且从进程调度器的运行队列中移走,我们称这个点为“睡眠点”。当请求的资源或者数据到达时,进程会被唤醒。然后从睡眠点开始执行。

四种I/O模型

Linux内核支持4中不同的I/O模型。需要说明的是,Linux系统的块设备和网络设备的I/O模式属于异步非阻塞型;而在字符设备中,其驱动程序应该根据具体的实现要求实现以下四种I/O模型中的部分或者全部(极少数的字符设备驱动需要去实现异步非阻塞)。

下面分别记录驱动中如何支持这四种模型

一、同步阻塞型I/O

这种操作会阻塞应用程序直到设备完成read/write操作或者返回一个错误码。在应用程序阻塞这段时间,程序所代表的进程并不消耗CPU的时间,因而从这个角度看,这种操作模式效率是非常高效的。为了支持这种I/O操作模式,设备驱动程序需要实现file_operations的read和wirte函数。

直接使用内核提供的API

驱动程序在实现阻塞型I/O时,可以直接使用内核提供的wait_event系统和wake_up系列函数,这些函数的核心设计建立在等待队列的基础上。

1)wait_event系统函数(等待在某一队列中直到某一条件满足)

wait_event_interrupt()

Linux内核中,该宏用来将当前调用它的进程睡眠等待在一个event上,直到进程被唤醒并且需要的condition条件为真。睡眠的进程状态时TASK_INTERRUPTIBLE的,这就意味着它可以被用户程序所中断而结束。但通常情况是等到的event事件发生了,它被唤醒重新加入到调度器的运行队列中等待下一次调度执行。

void init_wait_entry(struct wait_queue_entry *wq_entry, int flags)
{
    wq_entry->flags = flags;
    wq_entry->private = current;
    wq_entry->func = autoremove_wake_function;
    INIT_LIST_HEAD(&wq_entry->entry);
}
/*
1)init_wait_entry用来定义了一个名为“__wq_entry”的等待队列节点对象。__wq_entry中的
autoremove_wake_function函数在节点上的进程被唤醒时调用,private指向当前调用
wait_event_interruptible的进程。
2)prepare_to_wait_event用来完成睡眠前的准备工作,并且将__wq_entry节点加入到等待
队列wq中:__add_wait_queue(wq_head, wq_entry),该函数把__wq_entry节点接入到等到队列
中成为头节点后的第一个等待节点,所以后面进来的进程最先被唤醒;并把前进程状态设置为
TASK_INTERRUPTIBLE
3)prepare_to_wait_event之后进程仍然在调度器的运行队列中,当最后调用schedule()时,在
schedule这里调度器将把当前进程从它的运行队列中移除,schedule函数调用deactivate_task
函数来将当前任务从运行队列中移除,在多处理器系统中每个CPU都拥有自己的运行队列。
4)当condition为真时,通过break进入finish_wait,基本是prepare_to_wait_event的反向动作。
*/
#define ___wait_event(wq_head, condition, state, exclusive, ret, cmd)        \
({                                        \
    __label__ __out;                            \
    struct wait_queue_entry __wq_entry;                    \
    long __ret = ret;    /* explicit shadow */                \
                                        \
    init_wait_entry(&__wq_entry, exclusive ? WQ_FLAG_EXCLUSIVE : 0);    \
    for (;;) {                                \
        long __int = prepare_to_wait_event(&wq_head, &__wq_entry, state);\
                                        \
        if (condition)                            \
            break;                            \
                                        \
        if (___wait_is_interruptible(state) && __int) {            \
            __ret = __int;                        \
            goto __out;                        \
        }                                \
                                        \
        cmd;                                \
    }                                    \
    finish_wait(&wq_head, &__wq_entry);                    \
__out:    __ret;                                    \
})

/*schedule()最为cmd*/
#define __wait_event_interruptible(wq_head, condition)                \
    ___wait_event(wq_head, condition, TASK_INTERRUPTIBLE, 0, 0,        \
              schedule())

/*在condition不为真时,将睡眠在一个等待队列wq_head上,所以函数首先判断condition是否为真
如果为真,函数将直接返回,否则调用它的进程将通过__wait_event_interruptible最终进入睡眠
状态*/
#define wait_event_interruptible(wq_head, condition)                \
({                                        \
    int __ret = 0;                                \
    might_sleep();                                \
    if (!(condition))                            \
        __ret = __wait_event_interruptible(wq_head, condition);        \
    __ret;                                    \
})

由以上源码可以见wait_event_interruptable的表现形式时阻塞在了schedule()函数(kernel/sched/core.c)上直到进程下次被唤醒并被调度执行。当进程被唤醒时,schedule函数返回(此时进程状态为TASK_RUNNING,所在的等待节点__wq_entry已经从wq中删除)

wait_event()

该函数使调用的进程进入等待队列,赋予睡眠进程的状态是TASK_UNINTERRUPTIBLE。该函数与wait_event_interruptible的区别是,它使睡眠的进程不可被中断,而且当进程被唤醒时也不会检查是否有等待的信号需要处理。

wait_event_timeout()

该函数与wait_event的区别时,会指定一个时间期限,在指定的时间到达时将返回0。

wait_event_interruptible_timeout()

该函数与wait_event_interruptible的区别时,会指定一个时间期限,在指定的时间到达时将返回0。

2)wake_up系列和wake_up_interruptible系列函数

wake_up_interruptible()

用来唤醒一个等待队列上的睡眠进程

int try_to_wake_up(struct task_struct *p, unsigned int state, int wake_flags)
{
/*函数用p->state & state将wake_up系列函数中的进程状态与要唤醒的进程的状态进行检查,如果
p->state & state = 0的话那么唤醒操作返回0,是一次不成功的操作。因此可以看出
wake_up_interruptible只能唤醒通过wait_event_interruptible睡眠的进程。*/
}

/*传入TASK_INTERRUPTIBLE的参数会在调用等待节点上的func,也就是autoremove_wake_function
会用到,实际的代码发生在try_to_wake_up函数里*/
#define wake_up_interruptible(x)    __wake_up(x, TASK_INTERRUPTIBLE, 1, NULL)

对于一个等待队列x, wake_up_interruptible(x)最后调用了__wake_up_common,后者通过list_for_each_entry_safe_from对等待队列x进行遍历,对于遍历过程的每个等待节点,都会调用该节点上的函数func,也就是前面的autoremove_wake_function函数,其主要功能是唤醒当前节点上的进程(把进程加入调度器的的运行队列,进程状态变为TASK_RUNNING),并将等待节点从等待队列删除,通常情况下函数都会成功返回1。

    list_for_each_entry_safe_from(curr, next, &wq_head->head, entry) {
        unsigned flags = curr->flags;
        int ret;

        if (flags & WQ_FLAG_BOOKMARK)
            continue;

        ret = curr->func(curr, mode, wake_flags, key);
        if (ret < 0)
            break;
        if (ret && (flags & WQ_FLAG_EXCLUSIVE) && !--nr_exclusive)
            break;

        if (bookmark && (++cnt > WAITQUEUE_WALK_BREAK_CNT) &&
                (&next->entry != &wq_head->head)) {
            bookmark->flags = WQ_FLAG_BOOKMARK;
            list_add_tail(&bookmark->entry, &next->entry);
            break;
        }
    }

从上面代码可以看到,如果想让函数遍历结束,必须满足以下三个条件:

  1. 负责唤醒进程的函数func成功返回;

  1. 等待节点的flags成员设置了WQ_FLAG_EXCLUSIVE标志,这个是排他性的,如果设置有该标志,那么唤醒当前节点上的进程后将不会再继续唤醒操作;

  1. nr_exclusive等于1,nr_exclusive表示运行唤醒的排他性进程的数量。

在此可以将函数结束继续唤醒队列中的进程的条件简单归纳为:遇到一个排他性唤醒的节点并且当前允许排他性唤醒的进程数量为1。

其他一些wake_up系列/wake_up_interruptible系列函数

wake_up_interruptible函数在内核中同样有自己的一些变体,它们之间的主要区别除了TASK_INTERRUPTIBLE和TASK_UNINTERRUPTIBLE之外,在于每次调用时视图唤醒的进程数量,因为唤醒一个进程不存在timeout问题,所以没有类似类似wake_up_timeout这样的函数。

#define wake_up(x)            __wake_up(x, TASK_NORMAL, 1, NULL)
#define wake_up_nr(x, nr)        __wake_up(x, TASK_NORMAL, nr, NULL)
#define wake_up_all(x)            __wake_up(x, TASK_NORMAL, 0, NULL)
#define wake_up_locked(x)        __wake_up_locked((x), TASK_NORMAL, 1)
#define wake_up_all_locked(x)        __wake_up_locked((x), TASK_NORMAL, 0)

#define wake_up_interruptible(x)    __wake_up(x, TASK_INTERRUPTIBLE, 1, NULL)
#define wake_up_interruptible_nr(x, nr)    __wake_up(x, TASK_INTERRUPTIBLE, nr, NULL)
#define wake_up_interruptible_all(x)    __wake_up(x, TASK_INTERRUPTIBLE, 0, NULL)
#define wake_up_interruptible_sync(x)    __wake_up_sync((x), TASK_INTERRUPTIBLE)
  1. 因为TASK_NORMAL在内核中的定义如下,所以wake_up可以取代wake_up_interruptible,也可以用来唤醒wait_event而睡眠的进程。

#define TASK_NORMAL            (TASK_INTERRUPTIBLE | TASK_UNINTERRUPTIBLE)
  1. wake_up_nr和wake_up_all表示可以唤醒的排他性进程的数量,前者可以唤醒nr个这样的进程,后者可以唤醒队列中的所有排他性进程。wake_up则只能唤醒一个,当然对于非排他性节点上的进程,这些函数都会视图去唤醒它们。

  1. 对于wake_up_interruptible系列函数除了只能唤醒TASK_INTERRUPTIBLE状态的进程外,其他的功能和wake_up系列一样.

  1. wake_up_locked和wake_up的唯一区别是,后者内部会使用等待队列自旋锁,而前者不会。所以如果使用wake_up_locked时需要自己考虑加锁问题。

  1. wake_up_interruptible_sync用来保证调用它的进程不会被唤醒的进程所抢占而调度出处理器。

不直接使用内核提供的API

内核为以上讨论的wait_event/wake_up/wake_up_interrupt等系列函数中为等待队列提供了默认的操作模式。当然若不满足开发需求时驱动开发时可以按照wait_event和wake_up等函数的实现原理来构建自己的睡眠唤醒函数,比如一个典型的睡眠序列:

DECLARE_WAITQUEUE(wait, current);  //定义一个等待节点wait
set_current_state(TASK_UNINTERRUPTIBLE); //设置进程状态
add_wait_queue(&xxx_wq, &wait);  //将节点加入等待队列
schedule(); //让进程进入睡眠状态
remove_wait_queue(&xxx_wq, &wait); //唤醒以后将等待节点从队列移除

DECLARE_WAITQUEUE、 add_wait_queue这两个动作加起来完成的效果如下图所示。 在wait_queue_head_t指向的链表上, 新定义的wait_queue元素被插入, 而这个新插入的元素绑定了一个task_struct(当前做xxx_write的current, 这也是DECLARE_WAITQUEUE使用“current”作为参数的原因) 。

二、同步非阻塞型I/O

这种操作模式下,用于要求以O_NONBLOCK标志的形式传达到驱动程序中,如果用户希望这是一个不能阻塞的操作,就需要在open这个文件时指定O_NONBLOCK或者在read/write前在指定的文件描述符上通过fcntl函数设置O_NONBLOCK标志。

比如这种情况下驱动程序可以通过传递到read/write函数的参数struct file *filp来获取这一信息:若用户指定了O_NONBLOCK的情形下,filp->f_flags & O_NONBLOCK的结果为真。在这种情况下如果设备不能立即完成用户程序所需的I/O操作,应该返回一个错误码(EAGAIN或EWOULDBLOCK,二者是同一个值)来宣告结束;否则应默认按照阻塞方式来进行。

#define    EAGAIN        35    /* Try again */
#define    EWOULDBLOCK    EAGAIN    /* Operation would block */

三、异步阻塞型I/O

这种模式的I/O操作并不是阻塞在设备的读写操作本身,而是阻塞在同一组设备文件的描述符上,当其中的某些描述符上代表的设备对读写操作已经就绪时,阻塞状态将被解除,用户程序随后可以对这些描述符代表的设备进行读写操作。

具体到Linux的字符设备驱动程序上就是需要实现file_operations中的poll函数以支持I/O模式。相对于驱动程序用户空间除了原生态的poll调用外,还有select和epoll。但是对于驱动来说,这些应用层调用最终到驱动程序里只由poll函数来实现。

__poll_t (*poll) (struct file *, struct poll_table_struct *);

四、异步非阻塞型I/O

在这种I/O操作模式下,读写操作会立即返回,用户程序的读写请求会被放入一个请求队列中由设备在后台异步完成,当设备完成了本次的读写操作时,及那个通过signal或者回调函数的方式通知用户程序。这里需要注意

Linux系统中AIO有二种实现方式:

1) glibc提供了一个不依赖于内核的用户空间的AIO支持

它本质上是借用了多线程模型, 用开启新的线程以同步的方法来做I/O, 新的AIO辅助线程与发起AIO的线程以pthread_cond_signal() 的形式进行线程间的同步。 glibc的AIO主要包括如下函数:

aio_read()
aio_write()
aio_error()
aio_return(
aio_suspend()
aio_cancel()
lio_listio()

2)在内核中实现,并为用户空间提供了统一的AIO系统调用接口

内核空间原理

这里需要注意AIO一般由内核空间的通用代码处理, 对于块设备和网络设备而言, 一般在Linux核心层的代码已经解决。

对于块设备而言, AIO可以一次性发出大量的read/write调用并且通过通用块层的I/O调度来获得更好的性能, 用户程序也可以减少过多的同步负载, 还可以在业务逻辑中更灵活地进行并发控制和负载均衡。 相较于glibc的用户空间多线程同步等实现也减少了线程的负载和上下文切换等。

对于网络设备而言, 在socket层面上, 也可以使用AIO, 让CPU和网卡的收发动作充分交叠以改善吞吐性能。

另外对于字符设备驱动开发时一般也不需要实现AIO支持(Linux内核中对字符设备驱动实现AIO的特例包括drivers/char/mem.c里实现的null、 zero等?? )。

用户空间使用

内核AIO为用户提供的系统调用主要包括:

int io_setup(unsigned nr_events, aio_context_t *ctx_idp);
int io_destroy(aio_context_t ctx_id);
int io_submit(aio_context_t ctx_id, long nr, struct iocb **iocbpp);
int io_cancel(aio_context_t ctx_id, struct iocb *iocb,
                     struct io_event *result);
int io_getevents(aio_context_t ctx_id, long min_nr, long nr,
                        struct io_event *events, struct timespec *timeout);

在用户空间中, 我们一般要结合libaio来进行内核AIO的系统调用。

reference:

https://blog.csdn.net/wq897387/article/details/120828005

https://blog.csdn.net/qq_41386447/article/details/117232407

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/396848.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

jUnit的学习笔记

jUnit学习笔记要不要做单元测试的思考jUnit的使用jUnit的一些注意事项注解Assert断言JUnitCoreTestCaseTestResultTestSuite 测试套件忽略测试时间测试异常测试参数化测试jUnit中遇到的问题1.多线程测试时&#xff0c;jUnit自动退出了&#xff1f;2.测试入库的数据时&#xff0…

各种激活函数的计算公式、图像以及实现代码

激活函数已经成为神经网络中非常重要的一部分&#xff0c;随着各种类型的神经网络模型被人们开发出来&#xff0c;各种激活函数也应运而生&#xff0c;在不同的场景中&#xff0c;取得良好的效果。本文跟据著名的YOLO系列目标检测模型的源码 AlexeyAB Darknet&#xff0c;整理出…

HTML第5天 HTML新标签与特性

新标签与特性文档类型设定前端复习帮手W3Schoool常用新标签datalist标签&#xff0c;与input元素配合&#xff0c;定义选项列表fieldset元素新增input表单文档类型设定 document – HTML: 开发环境输入html:4s – XHTML: 开发环境输入html:xt – HTML5: 开发环境输入html:5 前…

如何在知行之桥EDI系统中定时自动更换交易伙伴AS2证书?

为了保证客户与交易伙伴之间数据传输的安全性&#xff0c;AS2传输协议中&#xff0c;通常会通过一对数字证书对传输数据进行签名和加密。但是证书是有有效期的&#xff0c;在证书到期之前&#xff0c;需要贸易双方及时更换新的证书。 在更新证书时&#xff0c;由于客户通常是和…

第十六节 接口

接口 接口是一种规范。规范也是一种公开的。 接口中的成分特点&#xff1a;JDK8之前接口中只能有抽象方法和常量。 接口的用法&#xff1a; ●接口是用来被类实现(implements)的&#xff0c;实现接口的类称为实现类。实现类可以理解成所谓的子类。 从上面可以看出&#xff0c…

网络的瓶颈效应

python从小白到总裁完整教程目录:https://blog.csdn.net/weixin_67859959/article/details/129328397?spm1001.2014.3001.5501 ❤ 网络的瓶颈效应 网络瓶颈&#xff0c;指的是影响网络传输性能及稳定性的一些相关因素&#xff0c;如网络拓扑结构&#xff0c;网线&#xff0…

了解栈Stack一篇文章就够了

什么是栈栈是一种特殊的线性表&#xff0c;只允许一端进行数据的插入和删除&#xff0c;即先进后出原则。类似于弹夹先装进去的子弹后面出&#xff0c;后放入的子弹先出。栈的底层原理栈是一种线性结构&#xff0c;所以既能使用数组实现&#xff0c;也能使用链表实现&#xff0…

【蓝桥杯刷题训练营】day05

1 数的分解 拆分成3个数相加得到该数 然后采用了一种巨愚蠢的办法&#xff1a; int main() {int count 0;int a 2;int b 0;int c 1;int d 9;int a1, a2, a3;int c1, c2, c3;int d1, d2, d3;for (a1 0; a1 < 2; a1){for (a2 0; a2 < 2; a2){for (a3 0; a3 <…

中断和事件

目录 中断概述 什么是中断&#xff1f; 什么是EXTI&#xff1f; EXTI初始化结构体&#xff1a; 中断/事件线&#xff1a; EXTI模式&#xff1a; 触发类型&#xff1a; EXTI控制&#xff1a; 什么是优先级&#xff1f; 什么是优先级分组&#xff1f; 什么是NVIC&#…

【Java】最新版本SpringCloudStream整合RocketMQ实现单项目中事件的发布与监听

文章目录前言依赖配置代码参考前言 SpringCloud项目中整合RocketMQ是为了削峰填谷。 这里我使用RocketMQ的作用用于接收项目中产生的消息&#xff0c;然后异步的发送邮件给客户&#xff0c;这是这个项目的产生的背景。 依赖配置 <dependencies><dependency><…

开发钉钉微应用,实现免登+调试

1.创建h5微应用 https://open.dingtalk.com/document/orgapp/develop-org-h5-micro-applications 根据里面的三个步骤,创建h5微应用 2.免登之前必须要先进行JSAPI的授权 文档说明: https://open.dingtalk.com/document/orgapp/jsapi-authentication 根据文档中的说明 步骤…

spring事物源码分析

今天的任务是剖析源码&#xff0c;看看Spring 是怎么运行事务的&#xff0c;并且是基于当前最流行的SpringBoot。还有&#xff0c;我们之前剖析Mybatis 的时候&#xff0c;也知道&#xff0c;Mybatis 也有事务&#xff0c;那么&#xff0c;他俩融合之后&#xff0c;事务是交给谁…

MySQL (六)------MySQL的常用函数、 事务(TCL)、DCL用户操作语句、常见环境、编码问题

第一章 MySQL的常用函数 1.1 字符串函数 1.1.1 字符串函数列表概览 函数用法CONCAT(S1,S2,......,Sn)连接S1,S2,......,Sn为一个字符串CONCAT_WS(separator, S1,S2,......,Sn)连接S1一直到Sn&#xff0c;并且中间以separator作为分隔符CHAR_LENGTH(s)返回字符串s的字符数LENGTH…

深入理解性能压测工具原理

如果没有性能测试工具如何通过手工实现 如果没有性能测试工具&#xff0c;通过手工进行性能测试&#xff0c;这是一个值得我们思考的问题。这时候需要一个协调员发送指令&#xff0c;一个操作员进行操作&#xff0c;对系统施加压力&#xff0c;多个操作员代表着多个用户进行并…

面向对象设计模式:创建型模式之原型模式

文章目录一、引入二、代理模式&#xff0c;Prototype Pattern2.1 Intent 意图2.2 Applicability 适用性2.3 类图2.4 应用实例&#xff1a;使用下划线或消息框展示字符串2.4 应用实例&#xff1a;JDK java.lang.Object java.lang.Cloneable一、引入 二、代理模式&#xff0c;Pr…

Python—看我分析下已经退市的 可转债 都有什么特点

分析 需求分析 可转债退市原因的种类与占比是多少 强赎与非强赎导致的退市可转债 存续时间 维度占比 强赎与非强赎导致的退市可转债 发行资金 规模占比 强赎与非强赎导致的退市可转债 各个评级 的占比 强赎与非强赎导致的退市可转债 各个行业&#xff08;一级行业&#xf…

互相关延时估计 Matlab仿真

文章目录互相关延时估计什么是互相关延时估计&#xff1f;原理代码实现总结互相关延时估计 互相关延时估计是一种信号处理技术&#xff0c;用于计算两个信号之间的时间延迟。在本篇博客中&#xff0c;我们将使用MATLAB来实现互相关延时估计&#xff0c;并提供多个例子和代码&a…

TypeScript深度剖析: TypeScript 中函数的理解?与 JavaScript 函数的区别?

一、是什么 函数是 JavaScript 应用程序的基础&#xff0c;帮助我们实现抽象层、模拟类、信息隐藏和模块 在 TypeScript 里&#xff0c;虽然已经支持类、命名空间和模块&#xff0c;但函数仍然是主要定义行为的方式&#xff0c;TypeScript 为 JavaScript 函数添加了额外的功能…

English Learning - L2-5 英音地道语音语调 弹力双元音 [ɪə] [ʊə] [eə] 2023.03.6 周一

English Learning - L2-5 英音地道语音语调 弹力双元音 [ɪə] [ʊə] [eə] 2023.03.6 周一朗读节奏元音的长度元音发音在清辅音和浊辅音前的区别元音发音跟后面浊辅音节数的区别元音在重读音节中复习大小元音发音对比/ʌ/ 舌中音/ɒ/ 舌后音/ʊ/ 舌后音/ɪ/ 舌前音[ɑ:] VS […

Jenkins+Docker自动化部署项目

看到了一篇文章&#xff0c;实操一下自动部署的感觉。参看地址&#xff1a;原文 首先更新docker&#xff0c;我更新到了 [rootlocalhost springboot]# docker --version Docker version 23.0.1, build a5ee5b1跟新步骤&#xff1a; yum update#卸载旧版本 yum remove dock…