[Linux][基础IO][二][缓冲区][理解文件系统]详细解读

news2025/3/18 2:49:59

目录

  • 1.缓冲区
    • 0.缓冲区的刷新策略
    • 1.何为缓冲区?
    • 2.总结
  • 2.理解文件系统
    • 0.文件元数据
    • 1.了解文件系统 --> 理解inode
    • 2.软硬链接

1.缓冲区

0.缓冲区的刷新策略

  • 一般情况
    1. 立即刷新
    2. 行刷新(行缓冲)
    3. 满刷新(全缓冲)
  • 特殊情况
    1. 用户强制刷新(fflush)
    2. 进程退出
  • 所有的设备,永远都倾向于全缓冲
    • 缓冲区满了,才刷新 --> 需要更少的IO次数 --> 更少次的外设访问 --> 提高效率
    • 和外部设备IO的时候,数据量的大小不是主要矛盾,和外设预备IO的过程是最耗费时间的
  • 一般而言
    • 行缓冲的设备文件 --> 显示器
    • 全缓冲的设备文件 --> 磁盘文件
  • 缓冲策略 = 一般 + 特殊

1.何为缓冲区?

int main()
{
    const char *msg0 = "hello printf\n";
    const char *msg1 = "hello fwrite\n";
    const char *msg2 = "hello write\n";

    printf("%s", msg0);
    fwrite(msg1, strlen(msg0), 1, stdout);
    write(1, msg2, strlen(msg2));
    
    fork();
    return 0;
}

// 运行结果:  
// hello printf
// hello fwrite
// hello write
  • 但如果对进程实现输出重定向呢? ./hello > file
运行结果:  
hello write
hello printf
hello fwrite
hello printf
hello fwrite
  • 发现printf和fwrite(库函数)都输出了2次,而write只输出了一次(系统调用)
    • 一般C库函数写入文件时是全缓冲的,而写入显示器是行缓冲
      • printf&fwrite库函数会自带缓冲区(进度条例子就可以说明)
    • 当发生重定向到普通文件时,数据的缓冲方式由行缓冲变成了全缓冲
      • 而放在缓冲区中的数据,就不会被立即刷新,甚至fork之后刷新
      • 但是进程退出之后,会统一刷新,写入文件当中
    • fork的时候,父子数据会发生写时拷贝,所以当父进程准备刷新的时候,子进程也就有了同样的一份数据,随即产生两份数据
    • write****没有变化,说明没有所谓的缓冲

2.总结

  • printf&fwrite库函数会自带缓冲区,而write系统调用没有带缓冲区
    • 这里所说的缓冲区, 都是用户级缓冲区
    • 其实为了提升整机性能,OS也会提供相关内核级缓冲区,不过不再我们讨论范围之内
  • 那这个缓冲区谁提供呢?
    • printf&fwrite是库函数, write是系统调用,库函数在系统调用的“上层”, 是对系统调用的“封装”
    • 但是write没有缓冲区,而printf&fwrite有 –> 该缓冲区是二次加上的,又因为是C,所以由C标准库提供

2.理解文件系统

0.文件元数据

  • ls -l读取存储在磁盘上的文件信息,然后显示出来
    在这里插入图片描述
模式 | 硬链接数 | 文件所有者 | 组 | 大小 | 最后修改时间 | 文件名
  • 这个信息除了通过ls -l来读取,还有一个stat命令能够看到更多信息
    在这里插入图片描述

1.了解文件系统 --> 理解inode

  • 可将磁盘抽象成线性的结构 --> 数组 <-- 类比磁带理解

    • 若想访问一个扇区,只要知道数组的下标即可
  • 对磁盘的管理 --> 对该数组的管理

    • 将数据存储到磁盘 --> 将数据存储到该数组
    • 找到磁盘特定扇区的位置 --> 找到数组特定的位置
  • 磁盘是典型的块设备,硬盘分区被划分为一个个的block

    • 磁盘可被分区 --> 对磁盘的管理 --> 对一个小分区的管理 --> 对一个块的管理
    • 一个block的大小是由格式化的时候确定的,并且不可以更改
      ![[Pasted image 20240223221244.png]]
  • Linux管理磁盘文件,是将文件内容和文件属性分开管理的

    • 文件 = 内容 + 属性
  • Block Group:ext2文件系统会根据分区的大小划分为数个Block Group

  • Super Block存放文件系统本身的结构信息(文件系统的属性信息),记录的信息主要有:

    • bolck和inode的总量
    • 未使用的block和inode的数量
    • 一个block和inode的大小
    • 最近一次挂载的时间,最近一次写入数据的时间,最近一次检验磁盘的时间等其他文件系统的相关信息
    • Super Block的信息被破坏,可以说整个文件系统结构就被破坏了
  • GDT:块组描述符,描述块组属性信息

    • 这个块组多大?已经使用了多少?
    • 有多少个inode?已经占用了多少个了?还剩多少个?
    • 一共有多少个block?使用了多少?
  • Block Bitmap:记录着Data Block中哪个数据块已经被占用,哪个数据块没有被占用

    • 如:10000+个blocks,10000+比特位,比特位和特定的block一一对应,比特位为1,代表该block被占用,否则表示可用
  • inode Bitmap:每个bit表示一个inode是否空闲可用

    • 如:10000+个inode,10000+比特位,比特位和特定的inode一一对应,比特位为1,代表该inode被占用,否则表示可用
  • inode Table:存放文件属性

    • 如:文件大小,所有者,最近修改时间等
    • inode是一个大小为128字节的空间,保存的是对应文件的属性
    • 块组内,所有文件的inode空间的集合,需要标识唯一性,每一个inode块,都要有一个inode编号
    • 一般而言:一个文件,一个inode,一个inode编号
  • Data blocks存放文件内容

    • 多个4KB(扇区*8)大小的集合,保存的都是特性文件的内容
    • 为什么不以512字节为单位? – 磁盘的基本单位扇区的大小 --> 512字节
      • 太小了,有可能会导致多次IO,进而导致效率的降低
      • 如果OS使用和磁盘一样的大小,万一磁盘基本大小变了的话,OS的源代码要不要进行更改?
      • 这样做到了 硬件 和 软件(OS) 进行解耦
  • 将属性和数据分开存放的想法看起来很简单,但实际上是如何工作的?

  • 创建一个新文件主要有以下4个操作:

  1. 存储属性
    • 内核先找到一个空闲的i节点(这里是263466),内核把文件信息记录到其中
  2. 存储数据
    • 该文件需要存储在三个磁盘块,内核找到了三个空闲块:300,500,800
    • 将内核缓冲区的第一块数据复制到300,下一块复制到500,以此类推
  3. 记录分配情况
    • 文件内容按顺序300,500,800存放,内核在inode上的磁盘分布区记录了上述块列表
  4. 添加文件名到目录
    • 新的文件名abc,Linux如何在当前的目录中记录这个文件?
    • 内核将入口(263466,abc)添加到目录文件,文件名和inode之间的对应关系将文件名和文件的内容及属性连接起来
  • 注意:

    • 目录是文件吗?
      • 是,有自己的inode,有自己的data block
      • data block下存的是 文件名:inode映射关系
      • 文件名、inode互为key值
    • 明明磁盘还有空间,为什么创建文件失败?
      • inode****是固定的,data block是固定的
      • 可能是inode数量不够了,也可能是data block数量不够了,导致无法分配

2.软硬链接

  • 软硬链接的本质区别:有没有独立的inode

  • 真正找到磁盘上文件的并不是文件名,而是inode

    • 在Linux中可以让多个文件名对应于同一个inode
  • 理解硬链接

    • 硬链接没有独立的inode --> 硬链接不是一个独立的文件
    • 硬链接是通过inode引用另外一个文件
      • 创建硬链接,不是真正的创建新文件
    • 创建硬链接,究竟做了什么?
      • 在指定的目录下,建立了 文件名 和 指定inode的映射关系 – 仅此而已
    • 硬链接通过引用计数来判断有多少个文件名和某inode有关联
      在这里插入图片描述
  • 理解软链接

    • 软连接有独立的inode --> 软链接是一个独立的文件
    • 软链接是通过名字引用另外一个文件
      • 可以理解成为:软连接的文件内容,是指向的文件对应的路径
      • 应用:相当于Windows下的快捷方式
  • 设置软硬链接

ln target_filename filename设置硬链接
ln -s target_filename filename设置软链接

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1598014.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

2024年山东三支一扶考试报名照片要求

2024年山东三支一扶考试报名照片要求

[spring] Spring Boot REST API - 项目实现

Spring Boot REST API - 项目实现 书接上文 Spring Boot REST API - CRUD 操作&#xff0c;一些和数据库相关联的注解在 [spring] spring jpa - hibernate CRUD 主要的 layer 如下&#xff1a; #mermaid-svg-QE1PR1gyrkz4XIT0 {font-family:"trebuchet ms",verdana…

TCP/IP协议—TCP

TCP/IP协议—TCP TCP协议TCP通信特点TCP技术概念TCP定时器 TCP头部报文TCP连接三次握手&#xff08;建立连接&#xff09;四次挥手&#xff08;释放连接&#xff09;连接状态 TCP协议 传输控制协议&#xff08;TCP&#xff0c;Transmission Control Protocol&#xff09;是一种…

政安晨:【Keras机器学习实践要点】(三十一)—— 使用全局上下文视觉变换器进行图像分类

目录 设置 简介 动机 结构 全局Token创建 模块 窗口 级别 模型 建立模型 预训练权重的理智检查 微调 GCViT 模型 配置 数据加载器 花卉数据集 为花卉数据集重建模型 训练 政安晨的个人主页&#xff1a;政安晨 欢迎 &#x1f44d;点赞✍评论⭐收藏 收录专栏: T…

【Linux C | 多线程编程】线程同步 | 条件变量(万字详解)

&#x1f601;博客主页&#x1f601;&#xff1a;&#x1f680;https://blog.csdn.net/wkd_007&#x1f680; &#x1f911;博客内容&#x1f911;&#xff1a;&#x1f36d;嵌入式开发、Linux、C语言、C、数据结构、音视频&#x1f36d; ⏰发布时间⏰&#xff1a;2024-04-15 0…

04—常用方法和正则表达式

一、字符串 1.length 属性返回字符串的长度(字符数)。 2.在字符串中查找字符串 indexOf() 字符串使用 indexOf() 来定位字符串中某一个指定的字符首次出现的位置 如果没找到对应的字符函数返回-1 lastIndexOf() 方法在字符串末尾开始查找字符串出现的位置。 3.replace() 方…

单片机STM32中断与事件的区别

【转】1-单片机STM32---中断与事件的区别 - Engraver - 博客园 (cnblogs.com) 路径不同&#xff0c;处理方式不同&#xff0c;是否有程序不同&#xff0c;是否有cpu参与不同。 事件是比中断更新的升级产物。

IGBT退饱和现象解析与防范

IGBT是一种重要的功率半导体器件&#xff0c;广泛应用于电力电子领域&#xff0c;如变频器、电动机驱动、电力传输等。在这些应用中&#xff0c;IGBT的导通和关断特性至关重要&#xff0c;而退饱和是IGBT工作过程中的一个重要现象。 IGBT的退饱和定义 退饱和是指IGBT在导通状态…

20240328-1-Prophet面试题

Prophet面试题 1. 简要介绍Prophet 常见的时间序列分解方法&#xff1a; 将时间序列分成季节项 S t S_t St​&#xff0c;趋势项 T t T_t Tt​&#xff0c;剩余项 R t R_t Rt​&#xff0c;即对所有的 t ≥ 0 t≥0 t≥0 y t S t T t R t y_{t}S_{t}T_{t}R_{t} yt​St​Tt…

【力扣】61. 旋转链表

61. 旋转链表 题目描述 给你一个链表的头节点 head &#xff0c;旋转链表&#xff0c;将链表每个节点向右移动 k 个位置。 示例 1&#xff1a; 输入&#xff1a;head [1,2,3,4,5], k 2 输出&#xff1a;[4,5,1,2,3] 示例 2&#xff1a; 输入&#xff1a;head [0,1,2], …

fs.1.10 ON CENTOS7 dockerfile模式

概述 freeswitch是一款简单好用的VOIP开源软交换平台。 centos7 docker上编译安装fs.1.10的流程记录&#xff0c;本文使用dockerfile模式。 环境 docker engine&#xff1a;Version 24.0.6 centos docker&#xff1a;7 freeswitch&#xff1a;v1.10.7 dockerfile 创建空…

NLP中的Transformer,一文掌握

Transformer变压器模型的出现 2017 年&#xff0c;Vaswani 等人在关键论文“Attention is All You Need”中介绍了 Transformer 模型&#xff0c;它标志着与以前占主导地位的基于递归神经网络的模型&#xff08;如 LSTM&#xff08;长短期记忆&#xff09;和 GRU&#xff08;门…

vscode 打代码光标特效

vscode 打代码光标特效 在设置里面找到settings 进入之后在代码最下方加入此代码 "explorer.confirmDelete": false,"powermode.enabled": true, //启动"powermode.presets": "fireworks", // 火花效果// particles、 simple-rift、e…

极狐GitLab x LigaAI,AI 时代研发提效新范式

GitLab 是一个全球知名的一体化 DevOps 平台&#xff0c;很多人都通过私有化部署 GitLab 来进行源代码托管。极狐GitLab 是 GitLab 在中国的发行版&#xff0c;专门为中国程序员服务。可以一键式部署极狐GitLab。 近日&#xff0c;极狐GitLab 和 LigaAI 宣布合作&#xff0c;双…

excel添加折线图,如何将日期作为横坐标?

就这么两列数据&#xff0c;想添加一个以日期为横坐标的折线图&#xff0c;但是出来的折线是这个样子&#xff0c;切换行/列也不行&#xff0c;怎么办呢&#xff1f; 实际上这个折线图中包括两条折线&#xff0c;蓝色的是日期的折线&#xff0c;橙色的是时间的折线&#xff0c;…

[lesson30]操作符重载的概念

操作符重载的概念 操作符重载 C中的重载能够扩展操作符的功能 操作符的重载以函数的方式进行 本质&#xff1a; 用特殊形式的函数扩展操作符的功能 通过operator关键字可以定义特殊的函数 operator的本质是通过函数重载操作符 语法&#xff1a; 可以将操作符重载函数定…

大数据中有多头借贷风险对贷款有影响吗?

大数据中有多头借贷风险对贷款有影响吗?相信不少人都有这个疑问&#xff0c;不知有没有发现&#xff0c;网上很多人都在说自己明明有授信额度&#xff0c;但是提交放款申请就会以大数据不良为由拒贷&#xff0c;其实就是自身大数据对借贷产生了影响&#xff0c;本文就详细为大…

var cannot be resolved to a type

var cannot be resolved to a type var 是JDK10的产物吧。真的是够懒的人&#xff0c;一个var自动转换类型。 高版本的功能又要放到低版本的平台系统中&#xff0c;【集成】&#xff0c;向下兼容天天改这些。

使用 Docker 部署 instantbox 轻量级 Linux 系统

1&#xff09;instantbox 介绍 GitHub&#xff1a;https://github.com/instantbox/instantbox instantbox 是一款非常实用的项目&#xff0c;它能够让你在几秒内启动一个主流的 Linux 系统&#xff0c;随起随用&#xff0c;支持 Ubuntu&#xff0c;CentOS&#xff0c; Arch Li…

[Java EE] 计算机工作原理与操作系统简明概要

1. 计算机工作原理 1.1 生活中常见的计算机 计算机分为通用计算机和专用计算机,计算机并不单单指的是电脑,还有我们平时使用的手机,ipad,智能手表等终端设备都是计算机.还有我们用户不常见的计算机,比如服务器. 还有许多嵌入式设备(针对特定场景定制的"专用计算机"…