【Linux修行路】文件系统之缓冲区

news2024/11/15 10:43:00

目录

⛳️推荐

一、先看现象

二、用户缓冲区的引入

三、用户缓冲区的刷新策略

四、为什么要有用户缓冲区

五、现象解释


⛳️推荐

前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到网站

一、先看现象

#include <stdio.h>
#include <string.h>
#include <unistd.h>

int main()
{
    const char* fstr = "Hello fwrite\n";
    const char* str = "Hello write\n";

    printf("Hello printf\n");
    fprintf(stdout, "Hello fprintf\n");
    fwrite(fstr, strlen(fstr), 1, stdout); // 返回值是写入成功的快数

    write(1, str, strlen(str)); // 返回值是写入成功的字节数

    // fork();
    return 0;
}

结构分析:带 fork 的输出重定向最终把有一些内容向 log.txt 文件中写入了多次,并且打印顺序也有所不同。

int main()
{
    const char* fstr = "Hello fwrite";
    const char* str = "Hello write";

    printf("Hello printf");
    fprintf(stdout, "Hello fprintf");
    fwrite(fstr, strlen(fstr), 1, stdout); // 返回值是写入成功的快数

    close(1);

    // write(1, str, strlen(str)); // 返回值是写入成功的字节数

    // fork();
    return 0;
}

结果分析:代码中只使用了库函数向显示器中进行写入,并且在字符串的结尾没有加 \n,在最后面将标准输出对应的文件描述符进行了关闭,最终显示器上什么也没有。上一段代码在字符串的结尾加上了 \n 最终字符串被成功的打印到了屏幕上。

int main()
{
    const char* str = "Hello write";

    write(1, str, strlen(str)); // 返回值是写入成功的字节数
    close(1);
    
    return 0;
}

结果分析:字符串的结尾依然不加 \n,但是这一次采用系统调用接口,最后仍然将标准输出对应的文件描述符进行关闭,这一次字符串被成功的打印了出来。

二、用户缓冲区的引入

write 为什么能将不带 \n 的字符串写入到显示器文件中。首先我们需要明确一点进程打开的每一个文件都有一个属于自己的操作系统级别的文件缓冲区,该缓冲区的存在,可以减少对外设的读写操作以提高计算机的效率。举个栗子,在一个进程中向磁盘里的同一个文件进多次行写入,文件缓冲区的存在,可以将每次写入的内容先存储在文件缓冲区中,最后在程序退出或者调用 close 的时候,一次性将文件缓冲区中的所有内容刷新到磁盘。如果没有该文件缓冲区,那在进程里对文件进行 n 次写操做,就要对应 n 次向磁盘的写操作,CPU 和外设之间是存在非常大的速度差的,这样效率会非常低。

write 作为系统调用接口,它就是直接向文件缓冲区中写入,最后在调用 close 接口或者程序退出的时候,会将文件缓冲区的内容刷新到对应的外设中。

printffprintffwrite 底层一定是封装了 write 系统调用接口,那为什么使用 write 系统调用接口就可以将字符串写入到显示器,使用 C 库函数没能把字符串写入到显示器文件?原因在进度条的那篇文章中讲过,我们使用的这些 C 库函数,是把字符串写入到到了缓冲区中,这个缓冲区和上面的文件缓冲区有所不同,这里说的缓冲区是 C 语言给我们提供的语言层面的缓冲区,也叫做用户级缓冲区\n 具有刷新用户级缓冲区的作用,因此不加 \n 并且在程序结束前将显示器对应的文件描述符进行了关闭,最终就导致字符串在用户级缓冲区中,没有被刷新到文件缓冲区,所以屏幕上就什么也没有。这里我们可以肯定,在这些 C 库函数中,并不是立即调用 write 接口,而是在遇到 \n 后才去调用 write 接口将用户缓冲区的内容刷新到文件缓冲区中。

总结:使用 C 系统调用接口向文件中写入,写入的内容先被存储在用户缓冲区中,在合适的时候(遇到 \n)才会进行刷新,这里刷新的本质是调用 write 将数据从用户缓冲区写入内核。

之前说的 exit 会刷新缓冲区,其实就是刷新用户缓冲区,因为 exit 作为 C 库函数,可以看见用户缓冲区,而 _exit 作为系统调用接口,无法看到语言层面的用户缓冲区,因此也就无法刷新用户缓冲区。

三、用户缓冲区的刷新策略

  • 无缓冲:直接刷新,数据不在用户缓冲区中停留。

  • 行缓冲:不刷新,直到碰到 \n

  • 全缓冲:缓冲区满了才刷新。

所谓刷新就是调用 write 接口将数据写入操作系统中的文件缓冲区。显示器文件对应采用的就是行缓冲,向磁盘文件中写入采用的是全缓冲。进程在退出的时候也会刷新用户缓冲区,还可以调用 fflush 进行刷新。

四、为什么要有用户缓冲区

  • 解决效率问题,缓冲区就像菜鸟驿站,不需要我们自己坐火车坐飞机去送东西,而是直接交给菜鸟驿站,然后就可以干自己的事情了,菜鸟驿站可以选择攒上一大批快递然后统一寄送出去。用户缓冲区的存在本质上提高了 C 语言的效率,也就是提高了用户的效率,因为 C 语言是程序员在使用,在使用 C 库函数进行文件写入时,大部分情况只需要把数据交给缓冲区,然后就可以快速的返回,不需要每一次都亲力亲为的去和操作系统打交道。

  • 配合格式化,有些和文件写入相关的 C 库函数是格式化输出函数,在我们看来,它可以写入整形、符点型,但是最终都是以字符串的形式进行写入。格式化就是将类型全都转化成字符串,先写入到用户缓冲区,用户缓冲区中存的一定都是字符串。

  • 用户缓冲区,有进也有出,将数据写入到用户缓冲区中就就叫做进,将用户缓冲区中的数据刷新到内核中的文件缓冲区中,被刷新的数据就可以从用户缓冲区中删掉,这就叫做出。用户缓冲就像就像水流一样源源不断,流的概念就是因此而来。

小TipsFILE 里面就有对应打开文件的缓冲区字段和维护信息。每个被进程打开文件都有自己对应的文件缓冲区。FILE 对象属于用户,用户缓冲区可以看作是在堆上申请的一块空间。

五、现象解释

这下再来解释上面代码中有 fork 然后重定向,写入了多次的原因。首先重定向后,将本来向显示器文件写入的内容,写到了磁盘文件,显示器文件的缓冲区采用行缓冲,即遇到 \n 就会刷新,而磁盘文件采用的是全缓冲,当缓冲区满了才刷新。因此在重定向后,会把三条 C 库函数写入的内容全部保存到缓冲区中,然后调用 fork 创建子进程,此时父子进程代码共享,数据写时拷贝,在程序退出的时候回去刷新用户缓冲区,上面说过,刷新就是将用户缓冲区中的数据写入到内核,然后将用户缓冲区中的内容清空,上面还说过,缓冲区就是在堆上申请的一段空间,可以看作数据部分,因为要删除数据,所以就会进行写时拷贝,此时之前父进程用户缓冲区中的内容就会给子进程拷贝一份,然后父子进程都执行刷新动作,各自刷新自己的缓冲区数据,这就是为什么最终出现多份的原因。没有重定向,只向显示器打印四条消息,是因为显示器采用的是行刷新策略,在调用 fork 前,对应的字符串就已经被刷新出去了。在 fork 的时候,父进程的用户缓冲区中是空的,什么也没有。

磁盘文件全缓冲验证

int main()
{
    const char* fstr = "Hello fwrite\n";
    const char* str = "Hello write\n";

    printf("Hello printf\n");
    sleep(2);
    fprintf(stdout, "Hello fprintf\n");
    sleep(2);
    fwrite(fstr, strlen(fstr), 1, stdout); // 返回值是写入成功的快数
    sleep(2);

    write(1, str, strlen(str)); // 返回值是写入成功的字节数

    sleep(5);

    fork();
    return 0;
}

分析:最先将 write 内容写入到文件中,因为它是直接写入到文件缓冲区,而剩下的 C 库函数对应的内容是统一一次全部刷新到内核,即使每个字符串后面都有 \n,但最后还是统一全部刷新,这就证明了磁盘文件采用的是全刷新策略。

🎁结语:

        今天的分享到这里就结束啦!如果觉得文章还不错的话,可以三连支持一下,您的支持就是我前进的动力!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2057731.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

BUG——imx6u开发_结构体导致的死机问题(未解决)

简介&#xff1a; 最近在做imx6u的linux下裸机驱动开发&#xff0c;由于是学习的初级阶段&#xff0c;既没有现成的IDE可以使用&#xff0c;也没有GDB等在线调试工具&#xff0c;只能把代码烧写在SD卡上再反复插拔&#xff0c;仅靠卑微的亮灯来判断程序死在哪一步。 至于没有使…

新加坡服务器托管:数字化引擎,企业托管的未来明星

在新加坡这片充满活力的土地上&#xff0c;托管服务正逐渐成为企业数字化转型与国际化战略的重要支撑。凭借其独特的地理位置、完善的基础设施、严格的法规环境以及政府对科技创新的积极推动&#xff0c;新加坡不仅成为了亚太地区的经济枢纽&#xff0c;也成为了全球企业托管业…

鸿蒙HarmonyOS实战:IPC与RPC设备内进程通信

基本 IPC&#xff08;Inter-Process Communication&#xff09;与RPC&#xff08;Remote Procedure Call&#xff09;用于实现跨进程通信&#xff0c;不同的是前者使用Binder驱动&#xff0c;用于设备内的跨进程通信&#xff0c;后者使用软总线驱动&#xff0c;用于跨设备跨进…

Leetcode JAVA刷刷站(53)最大子数组和

一、题目概述 二、思路方向 这个问题是一个经典的算法问题&#xff0c;称为“最大子序和”&#xff08;Maximum Subarray Problem&#xff09;。解决这个问题的一个高效方法是使用“Kadanes Algorithm”&#xff0c;它只需要遍历数组一次&#xff0c;就能在 O(n) 时间复杂度内…

模拟JDBC本质

以记事本形式模拟 编译所有文件,并运行 如果换成Oracle 重新编译并运行 利用反射,但是这种方式,还是需要重新编译 改成Oracle 再次编译 以读取配置文件的方式 编译之后 以后无需再次编译源码 只需要改配置文件 修改配置

如何将网站地图Sitemap提交至百度、谷歌及Bing搜索引擎

原文&#xff1a;如何将网站地图Sitemap提交至百度、谷歌及Bing搜索引擎 - 孔乙己大叔 (rebootvip.com) 在当今高度竞争的互联网环境中&#xff0c;搜索引擎优化&#xff08;SEO&#xff09;对于网站的可见性和成功至关重要。网站地图&#xff08;Sitemap&#xff09;&#xff…

新媒体智能化与定制开发 AI 智能名片小程序在工业 4.0 中的作用

摘要&#xff1a;本文探讨了新媒体作为客体所具有的智能以及在工业 4.0 进程中的重要性。分析了人赋予新媒体的四个方面智能&#xff0c;包括感知智能、运算智能、认知智能和智慧行为。同时&#xff0c;结合定制开发 AI 智能名片小程序这一具体案例&#xff0c;阐述了新媒体在工…

【ECMAScript性能优化的技巧与陷阱】

&#x1f3a5;博主&#xff1a;程序员不想YY啊 &#x1f4ab;CSDN优质创作者&#xff0c;CSDN实力新星&#xff0c;CSDN博客专家 &#x1f917;点赞&#x1f388;收藏⭐再看&#x1f4ab;养成习惯 ✨希望本文对您有所裨益&#xff0c;如有不足之处&#xff0c;欢迎在评论区提出…

csrf漏洞(三)

本文仅作为学习参考使用&#xff0c;本文作者对任何使用本文进行渗透攻击破坏不负任何责任。 前言&#xff1a; 本文依靠phpstudy以及dvwa靶场进行操作&#xff0c;具体搭建流程参考&#xff1a;xss漏洞&#xff08;二&#xff0c;xss靶场搭建以及简单利用&#xff09; 前篇…

有头单向链表的函数操作(详细版)

【1】代码展示 #include <stdio.h> #include <stdlib.h> typedef char datatype; // 重定义字符类型 typedef struct node {datatype data; // 数据用来存数据struct node *next; // 指针域用来存下一个节点的地址 } Node_t, *Node_p; // 重定义结构体数据…

5G三防加固平板电脑的特点与应用

随着信息技术的不断发展&#xff0c;5G通信技术也逐渐融入到三防平板电脑中。5G三防加固平板电脑是一种专为恶劣环境和工作场景设计的移动设备。它结合了5G通信技术、三防功能和加固设计&#xff0c;可以为用户带来更加高效、稳定、安全的使用体验。下面&#xff0c;我们来看看…

手把手系列 | 使用Milvus、Llama 3、Ollama、LangChain本地设置RAG应用

随着 Llama、Mistral、Gemma 等开源大语言模型&#xff08;LLM&#xff09;的出现&#xff0c;我们越来越能感受到 LLM 的力量&#xff0c;而本地运行基于 LLM 的 RAG 应用的需求越来越强烈。在将应用推至生产环境前&#xff0c;我们往往都需要先本地运行和测试。 因此&#xf…

[鹏城杯 2022]简单的php

题目源代码 <?phpshow_source(__FILE__); $code $_GET[code]; if(strlen($code) > 80 or preg_match(/[A-Za-z0-9]|\|"||\ |,|\.|-|\||\/|\\|<|>|\$|\?|\^|&|\|/is,$code)){die( Hello); }else if(; preg_replace(/[^\s\(\)]?\((?R)?\)/, , $code…

qemu启动iso/vmdk转换为qcow2镜像

安装qemu安装 https://qemu.weilnetz.de/w64/ 下载链接 Rock安装 https://rockylinux.org/zh-CN/download 下载&#xff0c;可以使用360等国产浏览器&#xff0c;可能自带加速功能&#xff0c;我这里使用最小版本 安装后在vmware中启动&#xff0c;无ip解决方案 执行命令 n…

OV SSL证书:增强网站信任与安全的重要保障

随着互联网的快速发展&#xff0c;电子商务、在线金融等行业的繁荣&#xff0c;网络安全问题日益凸显。为了确保用户数据的安全性和传输过程中的加密性&#xff0c;SSL证书&#xff08;Secure Sockets Layer&#xff09;成为了保护网站安全的重要工具。其中&#xff0c;OV SSL证…

跨平台无缝编辑,2024年免费视频剪辑工具全解析

在众多视频剪辑工具中&#xff0c;免费视频剪辑软件凭借其易用性、功能丰富性以及零成本的优势&#xff0c;赢得了广大用户的青睐。今天&#xff0c;就让我们一起盘点那些2024年大家都在用的免费视频剪辑软件&#xff0c;探索它们如何助力我们轻松实现创意梦想。 1.福昕视频剪…

基于springboot的太原学院商铺管理系统--论文pf

TOC springboot486基于springboot的太原学院商铺管理系统--论文pf 第1章 绪论 1.1 研究背景 互联网概念的产生到如今的蓬勃发展&#xff0c;用了短短的几十年时间就风靡全球&#xff0c;使得全球各个行业都进行了互联网的改造升级&#xff0c;标志着互联网浪潮的来临。在这…

机器人策略学习的Game Changer?伯克利提出Body Transformer

过去几年间&#xff0c;Transformer 架构已经取得了巨大的成功&#xff0c;同时其也衍生出了大量变体&#xff0c;比如擅长处理视觉任务的 Vision Transformer&#xff08;ViT&#xff09;。本文要介绍的 Body Transformer&#xff08;BoT&#xff09; 则是非常适合机器人策略学…

大语言模型 (LLM)是什么_

01.语言模型与大语言模型 2023年&#xff0c;让整个人类最为振奋的AI技术就是ChatGPT。“大语言模型&#xff08;Large Language Model&#xff09;”这个词也随之映入人们的眼帘。ChatGPT让人觉得惊艳之处&#xff0c;能够结合上下文&#xff0c;像人一样有逻辑性地回答问题&…

用Python在Ashare获取金融数据官方文档解读

Ashare&#xff0c;也被写作AKShare&#xff0c;是一个基于Python的开源完全免费的财经数据接口库。它的主要目的是为用户提供股票、期货、期权、基金、外汇、债券、指数、加密货币等金融产品的基本面数据、实时和历史行情数据、衍生数据的采集、清洗和落地的一整套工具。AKSha…