【零拷贝】

news2025/2/3 14:02:26

目录

一:了解IO基础概念

二:数据流动的层次结构

三:零拷贝

1.传统IO文件读写

2.mmap 零拷贝技术

3.sendFile 零拷贝技术


一:了解IO基础概念

理解CPU拷贝和DMA拷贝

​         我们知道,操作系统对于内存空间,是分为用户态和内核态的。用户态的应用程序无法直接操作硬件,需要通过内核空间进行操作转换,才能真正操作硬件。这其实是为了保护操作系统的安全。正因为如此,应用程序需要与网卡、磁盘等硬件进行数据交互时,就需要在用户态和内核态之间来回的复制数据。而这些操作,原本都是需要由CPU来进行任务的分配、调度等管理步骤的,早先这些IO接口都是由CPU独立负责,所以当发生大规模的数据读写操作时,CPU的占用率会非常高。

之后,操作系统为了避免CPU完全被各种IO调用给占用,引入了DMA(直接存储器存储)。由DMA来负责这些频繁的IO操作。DMA是一套独立的指令集,不会占用CPU的计算资源。这样,CPU就不需要参与具体的数据复制的工作,只需要管理DMA的权限即可。

​ DMA拷贝极大的释放了CPU的性能,因此他的拷贝速度会比CPU拷贝要快很多。但是,其实DMA拷贝本身,也在不断优化。

​ 引入DMA拷贝之后,在读写请求的过程中,CPU不再需要参与具体的工作,DMA可以独立完成数据在系统内部的复制。但是,数据复制过程中,依然需要借助数据总进线。当系统内的IO操作过多时,还是会占用过多的数据总线,造成总线冲突,最终还是会影响数据读写性能。

​ 为了避免DMA总线冲突对性能的影响,后来又引入了Channel通道的方式。Channel,是一个完全独立的处理器,专门负责IO操作。既然是处理器,Channel就有自己的IO指令,与CPU无关,他也更适合大型的IO操作,性能更高。

​ 这也解释了,为什么Java应用层与零拷贝相关的操作都是通过Channel的子类实现的。这其实是借鉴了操作系统中的概念。

channel知识点:

在计算机系统中,“通道”(Channel) 的具体作用范围取决于上下文(如硬件架构、操作系统或编程框架)。以下是不同场景下的解释:


通道是 数据传输的路径或抽象机制,通常不直接等同于“操作系统内存 ↔ 外设”的物理传输,而是分层协作中的一环。

(1) 硬件层的通道(如传统大型机)

  • 功能
    某些系统(如 IBM 大型机)的 I/O 通道 是专用硬件,直接管理外设(磁盘、磁带)与内存的传输。

  • 特点

    • 通道是独立于 CPU 的处理器,可执行复杂的 I/O 指令(如协议解析、数据分块)。

    • 直接与外设控制器交互,完成物理数据传输(类似增强版 DMA)。

  • 示例
    大型机中,通道从磁盘读取数据到内存,无需 CPU 干预。

(2) 操作系统层的通道(如设备驱动)

  • 功能
    操作系统通过 设备驱动内核 I/O 子系统 管理外设与内存的交互。

  • 特点

    • 通道在此上下文中更接近 逻辑抽象(如 /dev 下的设备文件)。

    • 实际数据传输依赖 DMAPIO(编程 I/O)

(3) 编程框架中的通道(如 Java NIO)

  • 功能
    Java NIO 的 Channel(如 FileChannelSocketChannel)是 用户空间与内核空间之间的桥梁

  • 特点

    • 通过系统调用与内核交互,数据在用户缓冲区(如 ByteBuffer)和内核的 Page Cache 之间传输。

    • 不直接操作外设,物理传输由操作系统和 DMA 完成。

二:数据流动的层次结构

计算机系统中,数据从程序到磁盘(或反向)的流动通常经过以下层级:

程序中的 IO 流 → 用户空间缓冲区 → 操作系统缓存页(内核空间) → 磁盘驱动 → 物理磁盘

示意图

程序代码               用户空间              内核空间              硬件层
┌───────────┐       ┌─────────────┐      ┌──────────────┐      ┌────────┐
│  IO 流    │ → → → │ 用户缓冲区   │ → → → │ Page Cache    │ → → → │ 磁盘   │
└───────────┘       └─────────────┘      └──────────────┘      └────────┘
                        (程序层)             (操作系统层)        (物理层)

 而零拷贝技术是减少用户空间和内存空间之间数据传输的次数,接下来,将进入零拷贝的讲解。

三:零拷贝

        零拷贝(Zero-copy) 是一种优化技术,旨在 减少或消除数据在内存中的冗余复制操作,从而提升 I/O 性能。它主要作用于 用户空间内存与内核空间内存之间的数据传输,但最终目标是减少整个数据链路(从磁盘到网络、或内存到外设)中的复制次数。

        对于Java应用层来说,零拷贝有mmap和sendFile两种方式。

1.传统IO文件读写

        说零拷贝技术之前,要先了解传统的IO文件读写是怎么样的,才能更好的理解零拷贝技术,下面先说传统IO的读写工作流程。

传统IO文件读写

      传统IO文件读写如下图1-1所示:

                                                图1-1 传统IO文件读写流程图

传统IO文件读写工作流程:

整体流程

Java 程序 → 用户空间 → 内核空间(Page Cache) → 磁盘
          (修改数据) ↑↓(读写)       (DMA 传输)

流程分三个阶段:读取数据修改数据写回数

详细步骤与层级交互

(1) 打开文件

  • Java 代码:使用 FileInputStreamFileChannelRandomAccessFile 打开文件。

  • 系统调用open(),触发内核创建文件描述符,建立程序与文件的连接。

(2) 读取数据(磁盘 → 内核空间 → 用户空间)

  1. 磁盘到内核空间(Page Cache)

    • DMA 传输:磁盘控制器通过 DMA(直接内存访问) 将文件数据直接读取到内核的 Page Cache,无需 CPU 参与。

    • 触发方式:Java 调用 FileChannel.read(ByteBuffer)InputStream.read(),底层触发 read() 系统调用。

  2. 内核空间到用户空间

    • 数据拷贝:内核将 Page Cache 中的数据复制到用户空间的缓冲区(如 byte[]ByteBuffer)。

    • 性能开销:此拷贝由 CPU 完成,是小文件读取的主要性能瓶颈。

(3) 修改数据(用户空间内操作)

  • Java 操作:在用户空间的缓冲区中修改数据(如字符串替换、字节操作)。

  • 示例

    String content = new String(buffer.array(), StandardCharsets.UTF_8);
    String modifiedContent = content.replace("old", "new");
    byte[] newData = modifiedContent.getBytes(StandardCharsets.UTF_8);

(4) 写回数据(用户空间 → 内核空间 → 磁盘)

  1. 用户空间到内核空间(Page Cache)

    • 数据拷贝:用户空间的修改后数据通过 FileChannel.write(ByteBuffer)OutputStream.write() 触发 write() 系统调用,将数据复制到内核的 Page Cache。

    • 延迟写入:数据暂存于 Page Cache,不会立即写入磁盘。

  2. 内核空间到磁盘

    • DMA 传输:操作系统通过 DMA 将 Page Cache 中的数据异步写入磁盘。

    • 刷盘时机

      • 定时刷盘:由内核线程(如 pdflush)定期将脏页(修改过的数据)写入磁盘。

      • 强制刷盘:调用 FileChannel.force(true) 触发 fsync() 系统调用,确保数据持久化。

(5) 关闭文件

  • Java 代码:调用 close() 释放文件描述符。

  • 系统调用close(),释放内核资源。

2.mmap 零拷贝技术

  mmap 零拷贝技术 的核心是通过内存映射文件(Memory-Mapped File)将文件内容直接映射到用户空间的虚拟内存,从而避免传统 I/O 中用户空间与内核空间之间的数据拷贝。

mmap零拷贝技术IO读写

       IO文mmap零拷贝技术文件读写如下图1-2所示:

                                        图2-1 mmap零拷贝技术文件读写流程图

mmap零拷贝IO文件读写工作流程:

工作流程概述

磁盘 → Page Cache →(内存映射)→ 用户空间虚拟内存 →(修改数据)→ Page Cache → 磁盘

 详细步骤

1. 打开文件并创建内存映射

  • 用户空间
    使用 FileChannel.map() 将文件映射到用户空间的虚拟内存。

  • 内核空间
    内核将文件的磁盘块映射到 Page Cache,并建立用户空间虚拟内存与 Page Cache 的映射关系。

  • 代码示例

    FileChannel channel = FileChannel.open(Paths.get("file.txt"), StandardOpenOption.READ, StandardOpenOption.WRITE);
    MappedByteBuffer buffer = channel.map(FileChannel.MapMode.READ_WRITE, 0, channel.size());

2. 读取数据

  • 用户空间
    用户程序直接通过 MappedByteBuffer 访问数据,无需显式调用 read()

  • 内核空间
    若数据未加载到 Page Cache,触发缺页中断,内核从磁盘读取数据到 Page Cache。

  • 零拷贝
    数据直接从 Page Cache 映射到用户空间,无需复制到用户缓冲区。

3. 修改数据

  • 用户空间
    用户程序直接修改 MappedByteBuffer 中的数据。

  • 内核空间
    修改后的数据标记为 脏页(Dirty Page),暂存于 Page Cache。

4. 写回磁盘

  • 用户空间
    调用 buffer.force() 强制将脏页刷回磁盘。

  • 内核空间
    内核将脏页从 Page Cache 写回磁盘的对应位置。

  • 代码示例

    buffer.force(); // 强制刷盘

5. 关闭映射

  • 用户空间
    关闭 FileChannel,释放映射的内存区域。

  • 内核空间
    解除内存映射,释放相关资源。

  • 代码示例

    channel.close();

3.sendFile 零拷贝技术

        早期的sendFile其实和mmap一样,实现机制还是依靠CPU进行页缓存与socket缓存区之间的数据拷贝,如图3-1所示。

                                 图3-1 早期的sendFile 读写流程图

         从Linux内核2.6.33版本开始,引入了对 Scatter-Gather DMA(分散-聚集 DMA) 的支持,优化了实现机制,在拷贝过程中,并不直接拷贝文件的内容,而是只拷贝一个带有文件位置和长度等信息的文件描述符FD,这样子就大大减少了需要传递的数据。而真实的数据内容,会交由DMA控制器,从页缓存中打包异步发送到socket中。如图3-2所示。

                                       图3-2 Linux内核2.6.33 版本 sendFile 读写流程图

注意: sendfile 系统调用 的主要设计目标是 将文件数据高效地发送到网络套接字,因此它 不支持将用户空间的数据直接写入磁盘

工作流程概述

磁盘 → Page Cache →(sendfile)→ 网卡

详细步骤

1. 打开文件

  • 用户空间
    使用 FileChannel 打开文件。

  • 内核空间
    内核将文件的磁盘块映射到 Page Cache

  • 代码示例

    FileChannel fileChannel = new FileInputStream("file.txt").getChannel();

2. 打开网络套接字

  • 用户空间
    使用 SocketChannel 打开网络连接。

  • 内核空间
    内核创建 Socket Buffer,用于管理网络数据。

  • 代码示例

    SocketChannel socketChannel = SocketChannel.open(new InetSocketAddress("host", 8080));

3. 使用 sendfile 发送数据

  • 用户空间
    调用 FileChannel.transferTo(),底层使用 sendfile 系统调用。

  • 内核空间
    数据直接从 Page Cache 通过 DMA 发送到网卡,绕过用户空间。

  • 代码示例

    fileChannel.transferTo(0, fileChannel.size(), socketChannel); // 零拷贝发送

4. 关闭资源

  • 用户空间
    关闭 FileChannelSocketChannel,释放资源。

  • 内核空间
    释放 Page Cache 和 Socket Buffer 资源。

  • 代码示例

    fileChannel.close();
    socketChannel.close();

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2291296.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

扩散模型(一)

在生成领域,迄今为止有几个主流的模型,分别是 GAN, VAE,Flow 以及 Diffusion 模型。 GAN:GAN 的学习机制是对抗性学习,通过生成器和判别器的对抗博弈来进行学习,这种竞争机制促使生成器不断提升生成能力&a…

【LLM-agent】(task6)构建教程编写智能体

note 构建教程编写智能体 文章目录 note一、功能需求二、相关代码(1)定义生成教程的目录 Action 类(2)定义生成教程内容的 Action 类(3)定义教程编写智能体(4)交互式操作调用教程编…

【Numpy核心编程攻略:Python数据处理、分析详解与科学计算】2.12 连续数组:为什么contiguous这么重要?

2.12 连续数组:为什么contiguous这么重要? 目录 #mermaid-svg-wxhozKbHdFIldAkj {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-wxhozKbHdFIldAkj .error-icon{fill:#552222;}#mermaid-svg-…

O3 模型正式上线,能否与 DeepSeek 一较高下?

OpenAI 最近推出了 GPT O3 模型,并对 ChatGPT Plus 用户的 O3-mini 版本进行了升级,提升了每日消息限额,从 50 条增加至 150 条。这一调整大大提升了用户体验,让更多用户有机会深入体验 O3 模型的能力。那么,O3 模型的…

计算机网络 应用层 笔记1(C/S模型,P2P模型,FTP协议)

应用层概述: 功能: 常见协议 应用层与其他层的关系 网络应用模型 C/S模型: 优点 缺点 P2P模型: 优点 缺点 DNS系统: 基本功能 系统架构 域名空间: DNS 服务器 根服务器: 顶级域…

MATLAB的数据类型和各类数据类型转化示例

一、MATLAB的数据类型 在MATLAB中 ,数据类型是非常重要的概念,因为它们决定了如何存储和操作数据。MATLAB支持数值型、字符型、字符串型、逻辑型、结构体、单元数组、数组和矩阵等多种数据类型。MATLAB 是一种动态类型语言,这意味着变量的数…

[SAP ABAP] SE11 / SE16N 修改标准表(慎用)

1.SE16N修改标准表 使用事务码ME16N进入到查询页面,填入要修改的标准表MARA,在事务码输入框中填入/H,回车之后点击按钮,进入Debug调试界面 把GD-SAPEDIT 与 GD-EDIT 的值更改为X然后点击按钮(快捷键按F8)进行下一步操作 可以在此…

Arduino大师练成手册 -- 控制 AS608 指纹识别模块

要在 Arduino 上控制 AS608 指纹识别模块,你可以按照以下步骤进行: 硬件连接 连接指纹模块:将 AS608 指纹模块与 Arduino 连接。通常,AS608 使用 UART 接口进行通信。你需要将 AS608 的 TX、RX、VCC 和 GND 引脚分别连接到 Ardu…

maven mysql jdk nvm node npm 环境安装

安装JDK 1.8 11 环境 maven环境安装 打开网站 下载 下载zip格式 解压 自己创建一个maven库 以后在idea 使用maven时候重新设置一下 这三个地方分别设置 这时候maven才算设置好 nvm 管理 npm nodejs nvm下载 安装 Releases coreybutler/nvm-windows GitHub 一键安装且若有…

Java实现LFU缓存策略实战

LFU算法原理在Java中示例实现集成Caffeine的W-TinyLFU策略缓存实战总结LFU与LRU稍有不同,LFU是根据数据被访问的频率来决定去留。尽管它考虑了数据的近期使用,但它不会区分数据的首次访问和后续访问,淘汰那些访问次数最少的数据。 这种缓存策略主要用来处理以下场景: 数据…

安卓(android)饭堂广播【Android移动开发基础案例教程(第2版)黑马程序员】

一、实验目的(如果代码有错漏,可查看源码) 1.熟悉广播机制的实现流程。 2.掌握广播接收者的创建方式。 3.掌握广播的类型以及自定义官博的创建。 二、实验条件 熟悉广播机制、广播接收者的概念、广播接收者的创建方式、自定广播实现方式以及有…

基于改进的强跟踪技术的扩展Consider Kalman滤波算法在无人机导航系统中的应用研究

在无人机组合导航系统中,精确的状态估计对于任务的成功执行至关重要。然而,系统面临的非线性特性和不确定性,如传感器的量测偏差和动态环境变化,常常导致传统Kalman滤波算法失效。因此,提出一种鲁棒且有效的滤波算法&a…

1.初识beamer

系列文章目录 初识beamer 文章目录 系列文章目录前言一、什么是beamer1.1 定义和背景1.2 使用场景1.3 Beamer优势 二、overleaf 入门beamer三、开始使用beamer3.1 新建一个beamer文件3.2 创建beamer页/帧3.3 目录页3.4 配置beamer整体风格 结束语 前言 工欲善其事&#xff0c…

DeepSeek R1本地化部署 Ollama + Chatbox 打造最强 AI 工具

🌈 个人主页:Zfox_ 🔥 系列专栏:Linux 目录 一:🔥 Ollama 🦋 下载 Ollama🦋 选择模型🦋 运行模型🦋 使用 && 测试 二:🔥 Chat…

《基于Scapy的综合性网络扫描与通信工具集解析》

在网络管理和安全评估中,网络扫描和通信是两个至关重要的环节。Python 的 Scapy 库因其强大的网络数据包处理能力,成为开发和实现这些功能的理想工具。本文将介绍一个基于 Scapy 编写的 Python 脚本,该脚本集成了 ARP 扫描、端口扫描以及 TCP…

基于Python的药物相互作用预测模型AI构建与优化(上.文字部分)

一、引言 1.1 研究背景与意义 在临床用药过程中,药物相互作用(Drug - Drug Interaction, DDI)是一个不可忽视的重要问题。当患者同时服用两种或两种以上药物时,药物之间可能会发生相互作用,从而改变药物的疗效、增加不良反应的发生风险,甚至危及患者的生命安全。例如,…

Linux环境下的Java项目部署技巧:环境安装

安装 JDK: 第上传 jdk 压缩安装包到服务器 将压缩安装包解压缩: tar -xvf jdk-8uXXX-linux-x64.tar.gz 配置环境变量: 编辑 /etc/profile 文件,在文件末尾添加以下内容: export JAVA_HOME/path/to/jdk //JAVA_HOME…

【系统迁移】将系统迁移到新硬盘中(G15 5520)

文章目录 前言问题描述解决步骤(红色为 debug 步骤)参考文献 前言 参数: 电脑 dell g15 5520硬盘:1T 自带硬盘 海力士 2230 -> 2T 西数蓝盘 2280 问题描述 电脑硬盘过小(且只有一个接口),将…

小智 AI 聊天机器人

小智 AI 聊天机器人 (XiaoZhi AI Chatbot) 👉参考源项目复现 👉 ESP32SenseVoiceQwen72B打造你的AI聊天伴侣!【bilibili】 👉 手工打造你的 AI 女友,新手入门教程【bilibili】 项目目的 本…

MySql运维篇---008:日志:错误日志、二进制日志、查询日志、慢查询日志,主从复制:概述 虚拟机更改ip注意事项

#先登录mysql mysql -uroot -p1234#通过此系统变量,查看当前mysql的版本中默认的日志格式是哪个 show variables like %binlog\_format%;1.2.3 查看 由于日志是以二进制方式存储的,不能直接读取,需要通过二进制日志查询工具 mysqlbinlog 来查…