关于I/O

news2025/1/10 1:57:00

I/O

    • 1. 概念
      • 1.1 页缓存的简单工作流程
      • 1.2 页缓存的写机制或者写触发的时机
      • 1.3 为什么需要套字节缓冲区
      • 1.4 套接字缓冲区的简单流程
    • 2. 传统I/O方式
      • 2.1 传统I/O读写流程
      • 2.2 传统 I/O的性能问题
    • 3. DMA技术
      • 3.1 将数据`写入`磁盘的流程
      • 3.2 从磁盘`读取`数据的流程
    • 4. 网络数据传输流程
      • 4.1 将数据写入网络的流程
      • 4.2 从网络读取数据的流程

1. 概念

  • 主存(Main memory)

    主存储器简称主存,也称内存。是计算机硬件的一个重要部件,其作用是存放指令和数据,并能由中央处理器(CPU)直接随机存取。现代计算机是为了提高性能,又能兼顾合理的造价,往往采用多级存储体系。即由存储容量小,存取速度高的高速缓冲存储器,存储容量和存取速度适中的主存储器是必不可少的。主存储器是按地址存放信息的,存取速度一般与地址无关。32位(比特)的地址最大能表达4GB的存储器地址。这对多数应用已经足够,但对于某些特大运算量的应用和特大型数据库已显得不够,从而对64位结构提出需求。

  • 缓存(Cache)

    每一个现代处理器(CPU)都配置高速缓存(Cache)。目前CPU高速缓存级别主要分为L1/L2/L3三个级别;三个级别的高速缓存,缓存大小逐级增加同时访问速度逐次降低。高速缓存存在的主要原因是解决CPU寄存器与主存在处理速度上不匹配问题,从而极大提高CPU使用效率

  • 页缓存(page cache)

    当应用程序要读取磁盘上的文件的时候,首先需要CPU将磁盘上的文件内容拷贝到主存中,然后我们再从主存中读取文件内容。但是,我们知道从磁盘属于慢速设备,主存属于高速设备,从磁盘传输数据到主存是比较慢的,所以为了均衡这种速度差,就有了类似于CPU 高速缓存一样的东西,叫做页缓存。
    页缓存,利用主存的空闲部分来缓存一些数据块,也就是页缓存中的页面,我们就把这部分缓存磁盘文件的空闲的主存叫做页缓存。

  • 脏数据

    是指事务对缓冲池中行记录的修改,并且还没有提交。

  • 脏读(dirty read)

    脏读就是指当一个事务正在访问数据,并且对数据进行了修改,而这种修改还没有提交到数据库中,这时,另外一个事务也访问这个数据,然后使用了这个数据。因为这个数据是还没有提交的数据,那么另外一个事务读到的这个数据是脏数据,依据脏数据所做的操作可能是不正确的。

  • 脏页

    脏数据和脏页是完全不同的两种概念,脏页指的是在缓冲池中已经被修改的页,但是还没有刷新到磁盘中,即数据库实例内存中的页和磁盘中的页的数据不一致。脏页的读取是非常正常的,脏页是数据库实例内存和磁盘异步造成的,这并不影响数据的一致性,脏页最终会被刷新到磁盘中。

  • 套接字缓冲区(socket buffer)

    操作系统在主存上开辟的一块空间,主要用于缓冲要写入网络的数据。

  • DMA

    直接内存访问(DMA,Direct Memory Access)是一些计算机总线架构提供的功能,它能使数据从附加设备(如磁盘驱动器)直接发送到计算机主板的内存上。
    DMA 技术就是我们在主板上放一块独立的芯片,称为协处理器(DMAC)。在进行内存和 I/O 设备的数据传输的时候,我们不再通过 CPU 来控制数据传输,而直接通过DMA。协处理器没有CPU强大,主要作用就是用于数据传输控制。DMA方式中,主存与I/0设备之间有一条数据通路(专用数据总线),则交换信息时无需像中断一样调用中断服务程序,数据不经过CPU,直接通过这条线传输,所以DMA是需要硬件支持的

1.1 页缓存的简单工作流程

当应用程序读取文件内容的时候, 首先会从页缓存中查找有无数据,如果有直接返回;如果没有,表示缺页,会触发一个缺页中断,然后需要从磁盘上加载,再放入页缓存。

1.2 页缓存的写机制或者写触发的时机

当页缓存页面有脏数据的时候,什么时候这些数据被写入磁盘呢?
第一:当应用程序调用刷盘的系统调用的时候,比如fsync, fdatasync, sync等则会将脏页写回磁盘;
第二:操作系统有一个后台线程,每间隔一定的时间就会将页缓存中的脏数据写入磁盘

注意:
页缓存和主存的关系: 页缓存属于主存的一部分,只不过是主存空闲的部分

1.3 为什么需要套字节缓冲区

我们向网络发送数据,需要对数据添加首部信息,而且还需要把数据拷贝到网卡上,然后由网卡写出。如果写的太频繁,则会需要频繁的发送中断请求和CPU频繁的将数据拷贝到网卡。所以,为了提升写的性能,引出了套接字缓冲区。

1.4 套接字缓冲区的简单流程

套接字缓冲区等待被写满,然后向CPU发出中断请求,执行中断处理程序,通知网卡驱动程序有数据发送,然后由驱动程序从套接字缓冲队列获取读取数据,拷贝到网卡的缓冲队列,然后由网卡写出到网络。

2. 传统I/O方式

2.1 传统I/O读写流程

  • CPU 发出对应的指令给磁盘控制器,然后返回;
  • 磁盘控制器收到指令后,于是就开始准备数据,会把数据放入到磁盘控制器的内部缓冲区中,然后产生一个中断;
  • CPU 收到中断信号后,停下手头的工作,接着把磁盘控制器的缓冲区的数据一次一个字节地读进自己的寄存器,然后再把寄存器里的数据写入到内存,而在数据传输的期间 CPU 是无法执行其他任务的。

在这里插入图片描述

2.2 传统 I/O的性能问题

我们知道,I/O操作分为 磁盘I/O操作网络I/O操作

前者是从磁盘中读取数据源输入到内存中,之后将读取的信息持久化输出在物理磁盘上;后者是从网络中读取信息输入到内存,最终将信息输出到网络中。

不管是磁盘I/O还是网络I/O,都是以字节为单位,在高并发、大数据场景中,很容易导致阻塞,因此性能是非常差的。还有,输出数据从用户空间复制到内核空间,再复制到输出设备,这样的操作会增加系统的性能开销,接下来我们来具体分析一下:

  1. 多次内存复制

输入操作在操作系统中的流程如下图所示:
在这里插入图片描述
User Space:指操作系统中的用户态,Kernel Space 是指操作系统中的 内核态,定义如下:

  • 用户态:只能受限的访问内存,且不允许访问外围设备,占用cpu的能力被剥夺,cpu资源可以被其他程序获取。
  • 内核态:cpu可以访问内存的所有数据,包括外围设备,例如硬盘,网卡,cpu也可以将自己从一个程序切换到另一个程序。

流程说明:

步骤1:用户态发出 read() 系统调用,向内核发起读请求;

步骤2:内核向硬件发送读指令,并等待读就绪;

步骤3:通过DMA,内核把将要读取的数据复制到指向的内核缓存中;

步骤4:操作系统内核将数据复制到用户空间缓冲区,然后read系统调用返回。

在这个过程中,数据先从外部设备复制到内核空间,再从内核空间复制到用户空间,这就发生了两次内存复制操作。这种操作会导致不必要的数据拷贝和上下文切换,从而降低I/O的性能。

  1. 阻塞

在传统 I/O 中,InputStream 的 read() 是一个 while 循环操作,它会一直等待数据读取,直到数据就绪才会返回。这就意味着如果没有数据就绪,这个读取操作将会一直被挂起,用户线程将会处于阻塞状态。

在少量连接请求的情况下,使用这种方式没有问题,响应速度也很高。但在发生大量连接请求时,就需要创建大量监听线程,这时如果线程没有数据就绪就会被挂起,然后进入阻塞状态。一旦发生线程阻塞,这些线程将会不断地抢夺CPU资源,从而导致大量的CPU上下文切换,增加系统的性能开销。

3. DMA技术

将IO设备与内存之间的数据传输工作交给DMA控制器,这样 CPU 就可以去处理别的事务

3.1 将数据写入磁盘的流程

  • 第一:用户程序将数据写入用户空间的缓冲区,然后调用write系统调用
  • 第二:CPU进入内核态,将数据写入拷贝到页缓存,写入成功,立即返回
  • 第三:用户进程调用系统调用fsync、fdatasync、sync等将页缓存中的脏页刷到磁盘;如果用户没有调用,操作系统后台线程也会间隔一段时间就刷盘。
  • 第四:CPU执行刷盘指令,会向磁盘控制器(DMA模式)发送写指令,告诉磁盘控制器要刷盘的数据在主存的位置、要刷盘多少数据、要刷到磁盘什么位置等,然后返回干其他事情了
  • 第五:DMA引擎向CPU发送DMA请求,申请控制总线和主存,申请成功后,开始从主存页缓存中将数据写入到磁盘。写完了之后,字计数器溢出,中断机构会向CPU发出中断请求,CPU收到中断请求后,开始处理中断程序,进行一些扫尾的工作,然后结束。

3.2 从磁盘读取数据的流程

  • 第一:用户程序调用read系统调用
  • 第二:CPU进入内核态,操作系统会检查页缓存是否有数据。如果有CPU拷贝这些数据到用户空间;如果没有则触发缺页中断,需要向磁盘调页,即从磁盘加载数据到页缓存
  • 第三:CPU向磁盘控制器发送读指令,并且告诉磁盘主存地址、要读取的数据长度、要从哪一个设备读,然后返回干其他事情了
  • 第四:磁盘控制器开始准备数据,磁盘数据准备好则放入数据缓冲区,并且通知DMA引擎。
  • 第五:DMA引擎向CPU发送DMA请求,申请获取总线和主存的使用权,申请成功后,开始将缓冲区寄存器的数据拷贝到主存
  • 第六:完成数据传输后,磁盘控制器中的中断机构向CPU发送中断信号,触发中断处理程序,进行扫尾工作
  • 第七:页缓存把数据返回给用户进程(取决于I/O模式,如果是同步读,则需要线程同步等待数据准备好)

在这里插入图片描述

4. 网络数据传输流程

4.1 将数据写入网络的流程

  • 第一:用户程序调用套接字API,比如write或者send系统调用
  • 第二:CPU进入内核态,此时会将数据拷贝到套接字缓冲区
  • 第三:协议栈处理套接字缓冲区的数据,但并不是立即发送。不立即发送的原因就是,每次写的数据大小是由应用程序决定,如果每次要发送的数据太少,就会发送大量的小数据包,导致网路效率下降,所以需要积累到一定数量再发送出去。一般来说是根据MTU来决定,以太网中MTU一般是1500字节,如果(数据包大小+40(数据帧的首部长度)) > MTU,则会分片,然后满了再发送出去;到那时如果没有满,难道一直等到数据包满了才可以发送吗,协议栈内部有一个计时器,到期了也会将数据发送出去
  • 第四:需要发送数据包的时候,协议栈会产生一个软中断,触发CPU中断处理程序,告诉网卡驱动程序有新的网络包需要发送
  • 第五:网卡驱动程序会从套接字缓冲区读取要发送的数据包,通过DMA拷贝到网络接口控制器(网卡)的数据缓冲区
  • 第六:等待网卡的数据缓冲区写满了之后,就会把数据发送出去

4.2 从网络读取数据的流程

  • 第一: 网卡收到网络数据包,放入数据缓冲区
  • 第二: 数据缓冲区满了,则通知DMA引擎
  • 第三: DMA引擎向CPU申请总线和主存的使用权,将缓冲区数据拷贝到主存的套接字缓冲区
  • 第四: 当拷贝完成后,操作系统怎么知道有数据包到来?所以需要一种机制通知操作系统。最简单方式就是触发中断,但是如果数据量很大,可能就会频繁触发中断,导致CPU没有时间执行其他的程序,从而影响系统性能。Linux 2.6引入了New API机制,综合中断和轮询的方式来接收网络数据包:第一次通过中断触发中断服务处理程序,然后唤醒软中断采用轮询方式来轮询数据,直到没有数据时才恢复中断,这样一次中断可以处理多个数据包,降低网卡中断带来的性能消耗。
  • 第五:网络控制器(网卡)的中断机构向CPU发出中断请求,CPU会执行内核中网卡驱动程序的处理逻辑:
    • #1 禁用网卡中断:避免后续数据处理频繁的向CPU发起中断
    • #2 打开软中断:有可能后续的中断服务处理程序执行时间长,会影响CPU执行其他的进程或者中断请求,所以使用软中断,主要通过轮询的方式获取数据并处理数据
  • 第六:软中断交给协议栈进行处理,协议栈对数据包进行拆包,并且将等待队列中的处于等待的线程加入到就绪队列,等待被CPU再次调度
    • #1 链路层识别上册协议(IPV4 or IPV6),去掉帧头和帧尾,然后交给网络层
    • #2 网络层取出IP头,判断网络包目标主机,如果不是当前主机,则转发;如果是去掉IP头,然后交给传输层
    • #3 取出TCP或者UDP头后,根据<源IP、源端口、目标IP、目标端口>四元组作为标识,找到对应的socket
      在这里插入图片描述

所以,制约网络拷贝数据速率的因素,包括:

  • 网络
  • 网卡
  • 硬盘(本身读写速度和硬盘缓存)
  • 内存速率
  • CPU(传统I/O)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/567796.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【python】制作一个点单小程序!

周末总是在吃的方面&#xff0c;及其纠结&#xff0c;今天来制作一个点单小程序&#xff0c;加入自己喜欢吃的东西&#xff0c;来慢慢挑选&#xff0c;让每个周末快乐无限&#xff01; 一.安装环境 python 3.7.8 QT xlrd、xlwt库使用pip接口进行安装 pip install xlrd pip …

DMBOK知识梳理for CDGA/CDGP——第一章数据管理

关 注gzh“大数据食铁兽“&#xff0c;回复“知识点”获取《DMBOK知识梳理for CDGA/CDGP》常考知识点&#xff08;第一章数据管理&#xff09; 第一章 数据管理 第一章在 CDGA|CDGP考试中分值占比均不是很高&#xff0c;主要侧重点是考概念性的知识&#xff0c;理解数据管理的…

设计模式 -第1部分 避免浪费- 第1章 Flyweight 模式 - 共享对象避免浪费

第1部分 避免浪费 注&#xff1a;其内容主要来自于【日】-结城浩 著《图解设计模式》20章节 极力推荐大家阅读原著 第1章 Flyweight 模式 - 共享对象避免浪费 1.1 Flyweight 模式 Flyweight 的意思"轻量级"&#xff0c;其在英文中的原意指比赛中选手体重最轻等级的一…

迪赛智慧数——饼图柱状图(基本饼图和基本柱状图):“怒路症”数据解读

效果图 35%的司机承认自己属于“路怒族”&#xff0c;还有65%的人表示自己不是“路怒族”。 近日&#xff0c;上海两车高架上斗气碰撞差点掉落高架&#xff0c;上海高架出现“史诗级”斗气车。小编在此呼吁大家&#xff0c;开车路上减压&#xff0c;避免坏情绪伴随&#xff0c…

DDoS攻击与防御(一)

前言 这章主要讲述DDoS攻击与防御方式 理论知识来源于 https://www.microsoft.com/zh-cn/security/business/security-101/what-is-a-ddos-attack 1&#xff1a;攻击 一般来说&#xff0c;DDoS 攻击分为三大类&#xff1a;容量耗尽攻击、协议攻击和资源层攻击。 1>容量耗尽…

shiro基于redis实现分布式权限管理,在加入shiro的缓存管理后,项目报错

shiro基于redis实现分布式权限管理&#xff0c;在加入shiro的缓存管理后&#xff0c;项目报错 报错信息概括解决其他详细报错信息 报错信息概括 2023-05-24 16:27:56.374 ERROR 28740 --- [nio-8092-exec-6] o.a.s.web.servlet.AbstractShiroFilter : session.touch() method …

水处理计算常用表格大全

第二章 设计方案城市污水处理厂的设计规模与进入处理厂的污水水质和水量有关&#xff0c;污水的水质和水量可以通过设计任务书的原始资料计算。2.1 厂址选择在污水处理厂设计中&#xff0c;选定厂址是一个重要的环节&#xff0c;处理广的位置对周围环境卫生、基建投资及运行管理…

加强密码安全,保护您的账户——ADSelfService Plus

在当今数字化时代&#xff0c;密码安全成为了每个人都需要关注的重要问题。随着越来越多的个人和组织依赖于互联网和电子系统进行业务和通信&#xff0c;确保账户的安全性变得尤为关键。在这方面&#xff0c;ADSelfService Plus是一个功能强大的解决方案&#xff0c;为用户提供…

版图设计工具解析-virtuoso的display.drf文件解析

1. display.drf文件解析 virtuoso的版图颜色定义分析 下图为virtuoso的版图颜色&#xff0c;包括填充&#xff0c;轮廓&#xff0c;彩点&#xff0c;线形 本文以smic18mmrf的display.drf文件进行解析 smic18的PDK包下存在display.drf文件 打开文件display.drf文件后看到如下…

ApiKit 简介安装以及如何使用

一、介绍 ApiKit 是接口管理、开发、测试全流程集成工具&#xff0c;定位 API 管理 Mock 自动化测试 异常监控 团队协作。 1、开发测试过程中的现状 yapi -- 管理接口文档 rap -- 前端开发mock数据 postman -- 开发调试接口、测试调用接口 jmeter -- 基本的压力测试 2…

1个普通Java程序员需要具备什么样的素质和能力才可以称得上高级工程师?

1个Java程序员具备什么样的素质和能力才可以称得上高级工程师&#xff1f; 这个问题也引发了我的一些思考&#xff0c;可能很多人会说&#xff0c;“作为高级工程师&#xff0c;基础得过硬、得熟练掌握一门编程语言、至少看过一个优秀开源项目的源代码、有过高并发/性能优化的…

【RocketMQ】RocketMQ入门

【RocketMQ】RocketMQ入门 文章目录 【RocketMQ】RocketMQ入门1. 消费模式2. 发送/消费 消息2.1 同步消息2.2 异步消息2.3 单向消息2.4 延迟消息2.5 批量消息2.6 顺序消息 1. 消费模式 MQ的消费模式大致分为两种&#xff0c;一种是推Push&#xff0c;一种是拉pull。 Push模式…

在变压器厂中使用 ISA-95 应用程序进行调度集成

介绍 在工业批量和连续生产/运营环境中&#xff0c;调度涉及将诸如罐、反应器和其他加工设备之类的资源分配给生产/运营任务。第 4 层生产/运营计划确定要制造什么产品、要制造多少产品以及何时制造。根据设备、物料、人员和班次的可用性&#xff0c;随着时间的推移分配资源。…

CSDN中如何获得铁粉(用心篇)

✅作者简介&#xff1a;2022年博客新星 第八。热爱国学的Java后端开发者&#xff0c;修心和技术同步精进。 &#x1f34e;个人主页&#xff1a;Java Fans的博客 &#x1f34a;个人信条&#xff1a;不迁怒&#xff0c;不贰过。小知识&#xff0c;大智慧。 &#x1f49e;当前专栏…

快速实现pytest自定义配置项,让Web自动化测试更便捷!

目录 前言&#xff1a; 一、什么是pytest.ini 二、在pytest.ini中添加自定义配置项 三、使用自定义配置项 四、结论 前言&#xff1a; WEB自动化测试是一个重要的环节&#xff0c;需要结合框架和工具进行开发。在WEB自动化测试中&#xff0c;常用的是pytest框架&#xff…

go sync包

官方文档&#xff1a;https://pkg.go.dev/sync 临界区 临界区(critical section)是指包含有共享数据的一段代码&#xff0c;这些代码可能被多个线程访问 或修改。临界区的存在就是为了保证当有一个线程在临界区内执行的时候&#xff0c;不能有其他任何线程被允许在临界区执行…

workquue

参考 讲解Linux内核工作队列workqueue源码分析 - 知乎 浅谈Linux内核中断下半部——工作队列&#xff08;work queue&#xff09; - 知乎 kernel/workqueue.c 初始化 /** 6004 * workqueue_init_early - early init for workqueue subsystem 6005 * 6006 * This is th…

字节测开5年经验之谈,1分钟了解自动化测试..

引子 写在最前面&#xff1a;目前自动化测试并不属于新鲜的事物&#xff0c;或者说自动化测试的各种方法论已经层出不穷&#xff0c;但是&#xff0c;能够明白自动化测试并很好落地实施的团队还不是非常多&#xff0c;我们接来下用通俗的方式来介绍自动化测试…… 本文共有2410…

WebSocket全双工通信SpringBoot实现

【IT老齐238】十分钟上手WebSocket全双工通信协议_哔哩哔哩_bilibili【IT老齐238】十分钟上手WebSocket全双工通信协议, 视频播放量 8348、弹幕量 23、点赞数 318、投硬币枚数 157、收藏人数 257、转发人数 30, 视频作者 IT老齐, 作者简介 老齐的个人V: itlaoqi001 ~~欢迎前来交…

kubernetes01

kubernetes基础 kubernetes介绍 Kubernetes是Google在2014年开源的一款容器集群系统&#xff0c;简称k8s Kubernetes用于容器化应用程序部署、扩展和管理&#xff0c;目标是让容器化应用简单高效 官方网站&#xff1a;https://kubernetes.io/ 官方文档&#xff1a;https://ku…