【Linux基础IO】深入解析Linux基础IO缓冲区机制:提升文件操作效率的关键

news2024/11/16 7:19:27

📝个人主页🌹:Eternity._
⏩收录专栏⏪:Linux “ 登神长阶 ”
🤡往期回顾🤡:暂无
🌹🌹期待您的关注 🌹🌹

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

❀Linux基础IO

  • 📒1. 什么是缓冲区
  • 📙2. stdio缓冲区机制
    • 🌞全缓冲、行缓冲与无缓冲
    • ⭐缓冲区刷新策略
  • 📚3. 典型函数与缓冲区操作
  • 📜4. 用户缓冲区和内核缓冲区
  • 📝5. FILE
    • 🌸实现C标准库函数
  • 📖6. 总结


前言:在Linux操作系统的广阔世界里,IO(输入/输出)操作是系统与外部设备(如硬盘、网络等)进行数据交换的基石。然而,直接而频繁地进行IO操作往往会成为系统性能的瓶颈,因为物理设备的访问速度远不及内存的处理速度。为了缓解这一矛盾,Linux引入了一系列高效的IO缓冲机制,通过在用户空间和内核空间之间设置缓冲区,以减少对物理设备的直接访问,从而提高数据处理的效率和系统的整体性能

学习Linux基础IO缓冲区,不仅是深入理解Linux操作系统内部工作原理的必经之路,也是优化系统性能、提升应用响应速度的关键技术之一。通过掌握IO缓冲区的概念、原理、管理机制以及优化策略,我们可以更好地理解和控制Linux系统的IO行为,从而在面对大数据量处理、高并发访问等挑战时,能够游刃有余地应对

让我们一同探索Linux IO缓冲区的奥秘,开启一段充满挑战与收获的学习之旅吧!


📒1. 什么是缓冲区

缓冲区(Buffer)在计算机科学中是一个重要的概念,它指的是一块用于临时存储数据的内存区域。缓冲区的主要目的是减少数据在传输或处理过程中的延迟,提高数据处理的效率,以及保护原始数据不被直接修改或破坏

验证缓冲区的存在:

printf("hello Linux");
sleep(1);

如果我们让这段伪代码运行,它不会立刻打印,而是等到程序结束时才会输出内容


关于缓冲区我们可以借用下图来理解
在这里插入图片描述

如果我们想将东西送给在异地的朋友时,我们不太可能亲自交到他的手上,我们可以通过菜鸟驿站将东西给他,当我们将快递交给快递站的时候,我们就认为将物品送出去了,但是在远方的朋友不会立刻受到快递,并且快递站也不会只单独送你这一个快递,它会等快递到达一定数量才会开始派送,这样会提高快递站的效率,这就和我们的缓冲区差不太多,所以缓冲区不会立刻刷新,它会等缓冲区内容到达一定数量,才会刷新缓冲区

缓冲区的主要作用:提高使用者的效率

  • 因为有缓冲区的存在,我们可以累计一部分在统一发送
  • 通过批量处理数据,缓冲区可以减少CPU中断的次数,从而提高系统性能
    在文件I/O操作中,操作系统可以将多个小的读写请求合并成较大的请求,以减少磁盘访问次数

📙2. stdio缓冲区机制

stdio缓冲区机制是C语言标准输入输出库(stdio.h)提供的一种用于提高数据读写效率的机制。缓冲区是一段内存区域,用于临时存储输入输出数据,以减少对磁盘或终端的直接读写次数,从而提高程序性能。stdio库中的函数,如printf、scanf、fread、fwrite等,都使用了缓冲区机制


🌞全缓冲、行缓冲与无缓冲

全缓冲:

  • 在全缓冲模式下,当缓冲区被填满时,才会进行实际的I/O操作
  • 默认情况下,对磁盘文件的读写操作采用全缓冲模式
  • 缓冲区的大小通常是固定的,如4096字节(但可以通过setvbuf函数调整)

行缓冲:

  • 在行缓冲模式下,当遇到换行符(\n)时,会执行I/O操作
  • 当流涉及终端(如标准输出stdout和标准输入stdin)时,通常使用行缓冲模式
  • 这使得输出能够按行显示,而不是等到缓冲区满时才显示

无缓冲:

  • 在无缓冲模式下,不对字符进行缓冲存储,即每次I/O操作都直接进行
  • 标准错误流(stderr)通常是无缓冲的,以确保错误信息能够立即显示

⭐缓冲区刷新策略

缓冲区刷新是指将缓冲区中的数据写入到目标设备(如磁盘或终端)的过程。stdio库提供了多种缓冲区刷新策略,以确保数据的及时性和完整性

以上讲的内容都是缓冲区的一般刷新策略

特殊情况:

  • 强制刷新
  • 当进程退出时,通常会隐式地刷新所有未刷新的缓冲区

📚3. 典型函数与缓冲区操作

在C语言中,stdio库中的典型函数与缓冲区操作密切相关。缓冲区是内存中的一块区域,用于临时存储输入输出数据,以提高程序性能


我们来看一段代码:

#include <stdio.h>
#include <sys/stat.h>
#include <sys/types.h>
#include <fcntl.h>
#include <string.h>

int main()
{
    printf("hello printf\n");
    fprintf(stdout, "hello fprintf\n");
    fputs("hello fputs\n", stdout);

    const char *msg = "system call: hello write\n";

    write(1, msg, strlen(msg));
                                                                                                                                                                                             
    return 0;
}

在这里插入图片描述

毋庸置疑,程序正常输出,我们来修改一下代码,看看会出现什么现象


我们在代码中加入 fork()

#include <stdio.h>
#include <sys/stat.h>
#include <sys/types.h>
#include <fcntl.h>
#include <string.h>

int main()
{
    printf("hello printf\n");
    fprintf(stdout, "hello fprintf\n");
    fputs("hello fputs\n", stdout);

    const char *msg = "system call: hello write\n";

    write(1, msg, strlen(msg));
    
    fork();                                                                                                                                                                                
    return 0;
}

在这里插入图片描述

让我们分析一下为什么只有一行代码的差距,却有两种不同的结果


代码分析

  • 我们直接向显示器打印时,显示器的刷新方式是行刷新,我们在输出的字符串中都有’\n’,我们在fork之前,所有数据均被刷新,包括system call
  • 重定向到log.txt,本质是往磁盘中写入数据,这时我们的刷新方式是全缓冲
  • 全缓冲就意味着,我们必须将缓冲区写满才会刷新,但是我们做不到,此时,数据依然存在于缓冲区
  • 目前我们谈论的缓冲区,只与C语言相关
  • C/C++提供的缓冲区,保存的一定是用户数据,属于进程在运行自己的数据,但是我们把数据交给OS时,数据就不再属于我们,而是属于OS
  • 当进程退出时,一般会刷新缓冲区,而刷新缓冲区属于"清空","写入"操作,fork后,任意一个进程退出,都会刷新缓冲区,这时就会发生写时拷贝
  • write属于系统调用,没有使用C语言缓冲区,直接将数据写入操作系统

📜4. 用户缓冲区和内核缓冲区

用户缓冲区和内核缓冲区是计算机系统中两个重要的概念,它们各自承担着不同的角色和功能,共同协作以提高系统的I/O性能和效率


在这里插入图片描述


📝5. FILE

在C语言中,FILE 是一个用于文件操作的结构体类型,它定义在 <stdio.h> 头文件中。FILE 结构体包含了文件操作的所有必要信息,比如文件的状态标志、当前的读写位置、缓冲区的地址等

在这里插入图片描述

我们在打开,关闭,读写文件时,都有一个FILE *的指针,所以我们进行输入,输出时,都需要FILE,FILE是一个结构体,里面包含了fd,FILE也会提供独立一个缓冲区,我们来验证一下

直接查看文件:

vim /usr/include/libio.h +246

在这里插入图片描述


🌸实现C标准库函数

这里也是简单实现了部分C标准库函数,感兴趣的朋友可以去看看
部分C标准库函数的模拟实现


📖6. 总结

在探索Linux基础IO缓冲区的旅程即将结束之际,我们不禁为这一强大而精细的机制所折服。IO缓冲区作为操作系统与用户程序之间数据传输的桥梁,不仅极大地提升了数据处理的效率,还巧妙地平衡了系统资源的使用与响应速度

通过本文的探讨,我们深入理解了Linux中IO缓冲区的核心概念、工作原理以及不同类型的缓冲区(如标准IO库缓冲、内核缓冲区等)之间的区别与联系。我们认识到,合理利用和配置缓冲区,对于优化程序性能、减少系统开销具有重要意义

在Linux的世界里,每一次对未知的探索,都是一次自我超越的旅程。愿我们都能在这条路上,越走越远,越走越宽。

在这里插入图片描述
希望本文能够为你提供有益的参考和启示,让我们一起在编程的道路上不断前行!
谢谢大家支持本篇到这里就结束了,祝大家天天开心!

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2163145.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

14.第二阶段x86游戏实战2-C++语言开发环境搭建-VisualStudio2017

免责声明&#xff1a;内容仅供学习参考&#xff0c;请合法利用知识&#xff0c;禁止进行违法犯罪活动&#xff01; 本次游戏没法给 内容参考于&#xff1a;微尘网络安全 本人写的内容纯属胡编乱造&#xff0c;全都是合成造假&#xff0c;仅仅只是为了娱乐&#xff0c;请不要…

基于jsonpath_ng的JSON数据查改增删

jsonpath_ng支持JSON数据的读写操作。 安装 pip install jsonpath-ng测试数据 from jsonpath_ng import parse import jsonjson_data { "store": {"book": [ { "category": "reference","author": "Nigel Rees&qu…

数据集-目标检测系列-鲨鱼检测数据集 shark >> DataBall

数据集-目标检测系列-鲨鱼检测数据集 shark >> DataBall 数据集-目标检测系列-鲨鱼检测数据集 shark 数据量&#xff1a;6k 想要进一步了解&#xff0c;请联系。 DataBall 助力快速掌握数据集的信息和使用方式&#xff0c;百种数据集&#xff0c;持续增加中。 示例&…

【自动驾驶】基于车辆几何模型的横向控制算法 | Stanley 算法详解与编程实现

写在前面&#xff1a; &#x1f31f; 欢迎光临 清流君 的博客小天地&#xff0c;这里是我分享技术与心得的温馨角落。&#x1f4dd; 个人主页&#xff1a;清流君_CSDN博客&#xff0c;期待与您一同探索 移动机器人 领域的无限可能。 &#x1f50d; 本文系 清流君 原创之作&…

【Python】探索 Elpy:Emacs 中的 Python 开发环境

可以短时间不开心&#xff0c;但别长时间不清醒。 对于使用 Emacs 编辑器的 Python 开发者来说&#xff0c;Elpy 是一个强大的集成开发环境&#xff08;IDE&#xff09;&#xff0c;它通过整合多个 Emacs Lisp 和 Python 包&#xff0c;提供了一套完整的 Python 编程支持。本文…

丹摩智算平台体验:AI开发从未如此简单

目录 初次接触丹摩智算GPU算力资源表格 轻松创建GPU实例镜像选择 实验过程体验实验中的一些细节 使用后的感受一点小建议总结 最近我一直在学习一些与深度学习相关的知识&#xff0c;准备自己动手做一些模型训练的实验。平时在自己电脑上跑模型总感觉有点吃力&#xff0c;特别是…

复制他人 CSDN 文章到自己的博客

文章目录 0.前言步骤 0.前言 在复制别人文章发布时&#xff0c;记得表明转载哦 步骤 在需要复制的csdn 文章页面&#xff0c;打开浏览器开发者工具&#xff08;F12&#xff09;Ctrl F 查找"article_content"标签头 右键“Copy”->“Copy element”新建一个 tx…

[大语言模型-论文精读] ACL2024-长尾知识在检索增强型大型语言模型中的作用

ACL2024-长尾知识在检索增强型大型语言模型中的作用 On the Role of Long-tail Knowledge in Retrieval Augmented Large Language Models Authors: Dongyang Li, Junbing Yan, Taolin Zhang, Chengyu Wang, Xiaofeng He, Longtao Huang, Hui Xue, Jun Huang 1.概览 问题解决&…

Windows驱动调试方法

单步调试驱动 驱动的调试不能直接在本机上进行&#xff0c;而是要放在虚拟机&#xff08;或其它设备&#xff09;中。这是因为在内核模式下&#xff0c;一个断点的触发将会停下整个系统而不只是单个进程。 在前面的文章里&#xff0c;使用了DbgPrint函数来进行日志的输出&…

学习一下怎么用git

目录 初始化操作 设置名字&#xff1a; 设置邮箱: 查询状态 初始化本地仓库 清空git bush控制台 git的三个区域 文件提交 将会文件提交到暂存区 暂存指定文件 暂存所有改动文件 查看暂存区里面的文件 将文件提交到版本库 git文件状态查看 ​编辑 暂存区的相关指令…

2024专业U盘格式化数据恢复工具推荐榜

对于经常在不固定办公地点工作&#xff0c;且依赖U盘存储重要资料的朋友来说&#xff0c;U盘无疑成为了随身携带的“数字保险箱”。然而&#xff0c;频繁使用U盘也意味着面临数据丢失的风险。面对u盘格式化怎么恢复数据的难题&#xff0c;您或许正寻求有效的解决方案。接下来&a…

Spring源码-从源码层面讲解传播特性

传播特性:service&#xff1a;REQUIRED&#xff0c;dao:REQUIRED 两个都是required使用的是同一个事务&#xff0c;正常情况&#xff0c;在service提交commit <tx:advice id"myAdvice" transaction-manager"transactionManager"><tx:attributes&…

2024年CSP-J认证 CCF信息学奥赛C++ 中小学初级组 第一轮真题-阅读程序题解析

2024 CCF认证第一轮&#xff08;CSP-J&#xff09;真题 二、阅读程序题 (程序输入不超过数组或字符串定义的范围&#xff0c;判断题正确填√错误填X;除特殊说明外&#xff0c;判断题 1.5分&#xff0c;选择题3分&#xff0c;共计40 分) 第一题 01 #include <iostream>…

【Python】探索 PyTorch 在机器学习中的应用

在机器学习的浪潮中&#xff0c;PyTorch 以其灵活性和易用性成为了研究者和开发者的热门选择。本文将探讨 PyTorch 在机器学习领域的应用&#xff0c;并展示如何使用 PyTorch 构建一个基本的机器学习模型。 ⭕️宇宙起点 &#x1f3ac; 机器学习简介&#x1f4a2; PyTorch 与机…

胤娲科技:AI程序员——重塑编程世界的魔法师

当魔法遇上代码 想象一下&#xff0c;一个对编程一无所知的初中生&#xff0c;在熙熙攘攘的展会现场&#xff0c;仅凭几句简单的提示词&#xff0c;就在几分钟内创造出一个功能完备的倒计时网页。 这听起来像是科幻电影中的场景&#xff0c;但如今&#xff0c;在阿里云「通义灵…

心觉:如何重塑高效学习的潜意识(1)两种方法的优缺点

Hi&#xff0c;我是心觉&#xff0c;与你一起玩转潜意识、脑波音乐和吸引力法则&#xff0c;轻松掌控自己的人生&#xff01; 挑战每日一省写作180/1000天 你的学习习惯是什么呢 学习的时候是感到轻松吗 很多人感觉现在是知识大爆炸的时代&#xff0c;每天都会产生海量的知…

C++学习笔记----8、掌握类与对象(一)---- 对象中的动态内存分配(2)

2.2、用析构函数释放内存 每当完成动态分配内存时&#xff0c;都应该释放。如果在一个对象中动态分配内存&#xff0c;释放内存的地方就是析构函数。编译器保证当对象被破坏时会调用析构函数。下面就是Spreadsheet类定义中的析构函数&#xff1a; export class Spreadsheet { …

秋分之际,又搭建了一款微信记账本小程序

在这个金色的季节里&#xff0c;每一粒粮食都蕴含着生命的奇迹&#xff0c;每一片叶子都在诉说着成长的故事。秋分之际&#xff0c;又搭建了一款微信记账本小程序。 产品概述 微信记账本小程序是一款便捷的个人财务管理工具&#xff0c;旨在帮助用户轻松记录、管理和分析日常…

STM32基础学习笔记-NVIC中断面试基础题4

第四章、NVIC: 外部中断_串口中断 1、按键按下后&#xff0c;GPIO 会产生一个上升/下降沿&#xff0c;G030内部是如何触发外部中断的呢&#xff1f; 配置GPIO引脚&#xff1a; 首先&#xff0c;需要将特定的GPIO引脚配置为输入模式&#xff0c;并设置为外部中断源。这通常通过…

Nexus3的妙用

nexus 3使用场景 Nexus是一个全能仓库,通过部署nexus可以实现包含yum、apt、Maven、pypi、docker等的多种仓库。以下是nexus的适用场景: 当公共仓库无法访问或缓慢时,搭建nexus。比如国内docker无法访问,需要镜像加速。可以使用海外主机部署nexus,在nexus中创建docker(p…