零拷贝并非万能解决方案:重新定义数据传输的效率极限

news2024/9/20 13:22:19

PageCache有什么作用?

在我们前面讲解零拷贝的内容时,我们了解到一个重要的概念,即内核缓冲区。那么,你可能会好奇内核缓冲区到底是什么?这个专有名词就是PageCache,也被称为磁盘高速缓存。也可以看下windows下的缓存区:如图所示:

image

零拷贝进一步提升性能的原因在于 PageCache 技术的使用。接下来,我们将详细探讨 PageCache 技术是如何实现这一目标的。

读写磁盘相比读写内存的速度慢太多了,但我们可以采取一种方法来改善这个问题,即将磁盘数据部分缓存到内核中,也就是将其存储在PageCache缓存区中。这个过程实际上是通过DMA(直接内存访问)控制器将磁盘数据拷贝到内核缓冲区中。

然而,需要注意的是,由于内存空间较磁盘空间有限,因此存在一系列算法来确保pageCache占用的内存空间不过大。我们在程序运行时都知道存在一种「局部性」,即刚刚被访问的数据在短时间内很可能再次被访问到,概率很高。因此,pageCache被用作缓存最近访问的数据。可以将pageCache看作是Redis,而磁盘则类似于MySQL。此外,pageCache还使用了内存淘汰机制,在内存空间不足时,会淘汰最近最久未被访问的缓存。

当在项目中使用 Redis 时,你一定知道如何使用它。和 Redis 类似, PageCache 的工作原理也是一样的。在进程需要访问数据时,它会首先检查 PageCache 是否已经存储了所需的数据。如果数据已经存在于 PageCache 中,内核会直接返回数据;如果数据未被缓存,则会从磁盘读取并将数据缓存到 PageCache 中,以备下次查询时使用。这种方式可以有效提高访问效率。

然而,pageCache还具有另一个优点,即预读功能。当访问并读取磁盘数据时,实际上需要定位磁盘中的位置。对于机械硬盘而言,这意味着磁头必须旋转到数据所在的扇区位置,然后开始顺序读取数据。然而,旋转磁头这种物理操作对计算机而言非常耗时。为了降低其影响,就出现了预读功能。通过预读功能,可以提前预读下一扇区的数据,减少等待磁头旋转的时间。

比如read方法需要读取32KB的字节的数据,使其在读取32KB字节数据后,继续读取后面的32-64KB,并将这一块数据一起缓存到pageCache缓冲区。这样做的好处在于,如果后续读取需要的数据在这块缓存中命中,那么读取成本会大幅降低。可以类比于redis中提前缓存一部分分布式唯一id用于插入数据库时的分配操作,这样就无需每次插入前都去获取一遍id。然而,一般情况下,为了避免可能出现的"毛刺"现象,我们通常会使用双缓存机制来处理。这个双缓存机制可以进一步优化读取操作的效果。

因此,PageCache的优点主要包括两个方面:首先,它能够将数据缓存到PageCache中;其次,它还利用了数据的预读功能。这两个操作极大地增强了读写磁盘时的性能。

但是,你可以想象一下如果你在传输大文件时比如好几个G的文件,如果还是使用零拷贝技术,内核还是会把他们放入pageCache缓存区,那这样不就产生问题了吗?你也可以想一下如果你往redis缓存中放了一个还几个G大小的value,而且还知道缓存了也没用,那不就相当于redis形同虚设了吗?把其他热点数据也弄没了,所以pageCache也有这样的一个问题,一是大文件抢占了pageCache的内存大小,这样做会导致其他热点数据无法存储在pageCache缓冲区中,从而降低磁盘的读写性能。此外,由于pageCache无法享受到缓存的好处,还会产生一个DMA数据拷贝的过程。

因此,最佳的优化方法是针对大文件传输时不使用pageCache,也就是不使用零拷贝技术。这是因为零拷贝技术会占用大量的内存空间,影响其他热点数据的访问优化。在高并发环境下,这几乎肯定会导致严重的性能问题。

大文件传输用什么方式实现?

那针对大文件的传输,我们应该使用什么方式呢?

让我们首先来观察最初的示例。当调用read方法读取文件时,进程实际上会被阻塞在read方法的调用处,因为它需要等待磁盘数据的返回。如下图所示:

image

在没有使用零拷贝技术的情况下,我们的用户进程使用同步IO的方式,它会一直阻塞等待系统调用返回数据。让我们回顾一下之前的具体流程:

  1. 应用程序发起read系统调用,用户进程开始进行阻塞等待结果返回。
  2. 此时内核会向磁盘发起I/O请求,磁盘收到请求后,开始寻址。当磁盘数据准备好后,就会向内核发起I/O中断,告知内核磁盘数据已经准备好。
  3. 内核收到中断信号后,将数据从磁盘控制器缓存区拷贝到pageCache缓冲区。
  4. 最后,内核会将pageCache中的数据再次拷贝到用户缓冲区,也就是用户态的内存中,然后read调用返回。

我们知道,既然有同步IO,就一定有异步IO来解决阻塞的问题。异步IO的工作方式如下图所示:

image

它将读操作分为两个部分:

  1. 第一部分是用户进程发起IO请求给内核,然后进程就不再关心该IO操作,而是继续处理其他任务。
  2. 第二部分是当内核接收到中断信号后,将数据直接拷贝到用户缓冲区,并通知用户进程操作成功。然后用户进程开始处理数据。

我们发现在这个过程中,并没有涉及到将数据拷贝到pageCache中,因此使用异步方式绕开了pageCache。直接IO是指绕过pageCache的IO请求,而缓存IO是指使用pageCache的IO请求。通常,对于磁盘而言,异步IO只支持直接IO。

正如前面所提到的,对于大文件的传输,不应该使用PageCache,因为这可能会导致PageCache被大文件占据,从而使得"热点"小文件无法充分利用PageCache的优势。

因此,在高并发的场景下,对于大文件传输,我们应该采用"异步I/O + 直接I/O"的方式来代替零拷贝技术。

直接I/O有两种常见的应用场景:

  1. 首先,如果应用程序已经实现了磁盘数据的缓存,就不需要再次使用PageCache进行缓存,这样可以减少额外的性能损耗。例如,在MySQL数据库中,可以通过参数设置来开启直接I/O,避免重复的缓存操作,默认情况下是不开启的。
  2. 其次,在传输大文件时,由于大文件很难命中PageCache的缓存,而且会占满PageCache导致"热点"文件无法充分利用缓存,增加了性能开销。因此,在这种情况下,应该使用直接I/O来绕过PageCache的缓存,以提高性能。

需要注意的是,直接I/O绕过了PageCache,因此无法享受内核的两项优化。

  1. 首先,内核的I/O调度算法会在PageCache中缓存尽可能多的I/O请求,然后将它们合并成一个更大的I/O请求发送给磁盘,以减少磁盘的寻址操作。
  2. 其次,内核会预读后续的I/O请求并将其放入PageCache中,同样是为了减少对磁盘的操作。这些优化在直接I/O中无法享受到。

于是,当我们需要传输大文件时,我们可以利用异步I/O和直接I/O的组合来实现无阻塞的文件读取。这种方式可以有效避免PageCache的影响,提高文件传输的效率。

因此,在文件传输过程中,我们可以根据文件的大小来选择不同的优化方式,以提高传输效率。对于大文件,使用异步I/O和直接I/O可以避免PageCache的影响;而对于小文件,则可以使用零拷贝技术来减少数据拷贝次数,提高传输速度。

在Nginx中,我们可以通过以下配置来根据文件的大小选择不同的优化方式:

location /video/ { 
    sendfile on; 
    aio on; 
    directio 1024m; 
}

在这个配置中,我们开启了sendfile选项,这允许Nginx使用零拷贝技术来传输文件。同时,我们也启用了aio选项,这使得Nginx可以使用异步I/O来提高文件传输的效率。

而通过设置directio参数为1024m,我们告诉Nginx当文件大小超过1024MB时,使用直接I/O来进行文件传输。这意味着在传输大文件时,Nginx将使用异步I/O和直接I/O的组合来实现无阻塞的文件读取,避免了PageCache的影响。而对于小文件,Nginx将继续使用零拷贝技术,以减少数据拷贝次数,提高传输速度。

总结

至此,我们的计算机基础专栏就结束了,不知道大家有没有发现,操作系统底层提供了丰富的解决方案来支持应用程序的复杂性和可扩展性。对于任何工作中遇到的问题,我们都可以从操作系统的角度寻找解决方法。

今天这一篇其实就是来打破零拷贝的方案神话的,没有一种技术是最好的,只有最合适的方法。我们需要根据具体的需求和情况来选择适合的解决方案,以提高应用程序的性能和可扩展性。谢谢大家的阅读和关注,希望这个专栏能对大家有所启发和帮助!

也请期待我的下一个专栏:【计算机网络篇】


我是努力的小雨,一名 Java 服务端码农,潜心研究着 AI 技术的奥秘。我热爱技术交流与分享,对开源社区充满热情。同时也是一位腾讯云创作之星、阿里云专家博主、华为云云享专家、掘金优秀作者。

💡 我将不吝分享我在技术道路上的个人探索与经验,希望能为你的学习与成长带来一些启发与帮助。

🌟 欢迎关注努力的小雨!🌟

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2058326.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

TY6802 同步整流PCB设计注意事项

TY6802 系列是一款用于反激式电源次级同步整流芯片,TY6802能可靠支持包括 DCM、CCM和准谐振模式。TY6802 集成了一个 100V 功率 MOSFET(TY6802A:100V15mR; TY6802B:100V10mR; TY6802C:100V7.5mR;) ,可以取代…

基于ESP32的OEE分析开发板上MQTT协议的实现

整理自 《Implementation of MQTT Protocol on ESP32-Based OEE Analysis Development Board》,作者是Amir Akbar Wicaksono, Yuli Kurnia Ningsih, 和 Indra Surjati,发表于《MITOR: Jurnal Teknik Elektro》。论文讨论了在工业4.0背景下,通…

数字化技术分别有哪些,数字化技术特点和优势是什么?

​随着企业数字化进程的加速,人工智能、工业互联网、低代码等底层技术正全面重塑企业运营生产体系,推动新的生产要素、研发范式和商业模式的建立。 这个变革过程不仅是对原有制造体系的颠覆,而且会影响各行各业的所有细分行业和产业链价值链…

探索地理空间分析的新世界:Geopandas的魔力

文章目录 探索地理空间分析的新世界:Geopandas的魔力背景:为何选择Geopandas?这个库是什么?如何安装这个库?五个简单的库函数使用方法场景应用:Geopandas在实际工作中的应用常见bug及解决方案总结 探索地理…

UE5 日期时间蓝图变量 加减节点

参考链接:Having troubles with DateTime in UE5 - General / Feedback & Requests - Epic Developer Community Forums (unrealengine.com) 直接粘贴到UE5蓝图图表可用。(反之相加,用负号操作一下) 减号蓝图节点(…

php源码编译与初始化

1 php源码编译 解压 yum install -y bzip2 # 安装解压工具 tar -xf php-7.4.12.tar.bz2 # 解压文件./condigure ./configure --prefix/usr/local/php --with-config-file-path/usr/local/php/etc --enable-fpm --with-fpm-usernginx --with-fpm-groupnginx --with-curl --wi…

Nginx--流量控制

前言:本博客仅作记录学习使用,部分图片出自网络,如有侵犯您的权益,请联系删除 一、流量限制 1、介绍 流量限制 (rate-limiting);可用来限制用户在给定时间内HTTP请求的数量。请求,可以是一个简单网站首页…

Element-UI Table实现列表筛选数据及列表嵌套选择框

VUE 框架在 Element UI 的基础上,Table 组件中实现了列表数据的修改功能,支持单选和多选功能,并且列表具备筛选功能。样式如图所示。 功能介绍 点击table列名实现筛选查询功能相关性判断点击列表中的正方形实现选择框功能,同时修…

设计模式-创建型模式-建造者模式

1.建造者模式定义 建造者模式又称生成器模式,将一个复杂对象的构建与表示分离,使得同样的构建过程可以创建不同的表示; 1.1 建造者模式优缺点 优点 封装性好,主要的业务员逻辑封装在指挥者类中;客户端不必知道产品内…

RabbitMQ练习(Work Queues)

1、RabbitMQ教程 《RabbitMQ Tutorials》https://www.rabbitmq.com/tutorials 2、环境准备 参考:《RabbitMQ练习(Hello World)》 确保RabbitMQ、Sender、Receiver容器正常安装和启动: rootk0test1:~# docker run -it --rm --…

流体中的流线【StreamLines】的实现

流线是一条线,它是 与瞬时速度方向相切(速度是一个矢量,并且 它有一个大小和一个方向)。为了在流程中可视化这一点,我们 可以想象一个小的标记流体元素的运动。例如,我们可以标记一个 用荧光染料滴水&#…

nginx和tomcat负载均衡

文章目录 一,tomcat1.tomca用途2.tomcat重要目录 二,nginx1.Nginx应用2.nginx作用3.nginx的正向代理和反向代理3.1正向代理3.2反向代理(单级)3.3反向代理(多级) 4.nginx负载均衡4.1Nginx支持的常见的分流算法1. 轮询(Round Robin):2.最少连接数(LeastCon…

OLED整体刷新到结合switch刷新方式演变

OLED整体刷新到结合switch刷新方式演变 引言 OLED刷新模式, 其实很简单, 就和prinf输出一样, 只是我们这里利用OLED来输出我们所需要的东西了。 至于OLED单独整体刷新, 还是利用switch刷新, 都是形而上学, 形的东西, 至于底层, 江协科技大佬已经帮我整理好了, 我们是站在巨人的…

[ 全部搞定 - 发票导出表格 ] PDF发票提取到表,图片发票提取到表格,扫描件发票提取到表格,全电发票PDF,全电发票扫描件识别导出EXCEL表格

最近很多朋友说找PDF发票提取Excel表格的,找到了图片识别Excel表格的,有的找图片识别Excel表格的,找到了PDF发票提取表格的,所以就很难搞,还有的说都想要 今天一篇文章,全部搞定所有发票【电子发票&#x…

运维学习————nginx3-keepalived及高可用nginx集群

目录 一、高可用nginx规划图 二、克隆一个nginx 启动测试 ​编辑 三、keepalived简介 四、安装配置keepalived保活nginx 4.1、安装 ​编辑 4.2、配置 4.2.1、主机配置(nginx1(主)配置) 4.2.2、从机配置(nginx2(主)配置)…

敏捷架构框架:数字化转型的核心驱动力

在数字化转型的浪潮中,传统的企业架构和组织结构正面临严峻挑战。为了在快速变化的市场环境中保持竞争力,企业不仅需要灵活的开发流程,还需要一种能够支持敏捷方法的架构体系。《数字化时代的敏捷架构》提出的敏捷架构框架(Agile …

建筑物规则化(实现) --- 特征边分组、重构、直角化

规则化建筑物 一、摘 要 建筑物多边形在地图综合中的两类处理模型:化简与直角化。 建筑物矢量数据来源广泛,在数据获取过程中,受GPS精确度、遥感影像分辨率或人为因素的影响,数据往往存在不同程度的误差。其中,图像分割、深度学习…

规范化JavaBean

Java Bean 是一个很常见的概念,简单来说就是一个 Java 类,其中的内容就是各种属性,以及各个属性的 getter/setter 。例如: class Student {private String name;private int age;public String getName() {return this.name;}pub…

网络协议与Netty

1、讲一讲什么是RPC? 说到RPC就必须要聊一聊单体项目和分布式/微服务项目 单体项目时:一次服务调用发生在同一台机器上的 同一个进程内部 ,也就是说调用发生在本机内部,因此也被叫作本地方法调用。 分布式/微服务项目时&#x…

负载均衡:定义与核心作用

负载均衡:定义与核心作用 一、负载均衡的定义二、负载均衡的核心作用 💖The Begin💖点点关注,收藏不迷路💖 负载均衡,作为网络技术的重要一环,对优化资源利用和提升服务器响应速度至关重要。本文…