文件操作之文件系统

news2024/11/29 16:37:32

目录

一 磁盘

1 磁盘的物理结构

2 磁盘在物理结构上如何存储数据

CHS寻址

3 从物理结构到抽象结构

LBA寻址

4管理

二 块组

boot block

super block

inode table

data blocks

block bitmap

GDT:Global Descriptor Table 块组描述符

三 文件名和目录之间的关系

四 从底层看文件操作

创建文件实质上是干了什么

删除文件实质上是干了什么

查看文件实质上是干了什么 

 五 软硬链接

本质区别:有无独立的inode 

软链接:

硬链接:


文件的种类:内存文件和磁盘文件

我们之前了解到的文件都是打开着的内存文件。但是系统中还存在着大量没有被打开的文件,这些文件在磁盘上存储着,叫做磁盘文件

那么我们怎么对磁盘文件进行管理呢?学习磁盘文件的侧重点又是什么呢?

学习磁盘文件主要是学习我们在磁盘中如何存储这个文件以及如何高效的存取文件

一 磁盘

存储文件有很多种介质。比如带电存储的内存和永久性存储的介质。磁盘是一种永久性的存储介质,永久性存储介质还有SSD,光盘,U盘等。SSD相比于磁盘速度更快但是价格更贵,出于性价比的考量,我们一般使用磁盘进行开发。

1 磁盘的物理结构

在学习磁盘文件之前,我们得先对磁盘的物理结构有一个基本的了解

磁盘基本上由四个部分构成:盘面,磁头,音圈马达,伺服系统

盘面是一摞一摞的,磁头是每一个面上分别有一个磁头,伺服系统就是他的一些电路结构,音圈马达就是带动这个磁盘工作所需的一些结构

磁盘如何工作的呢

由于计算机只认识二进制的0,1代码,因此我们可以联想到,磁盘的工作也是需要借助两态的东西来表达。现实生活中的磁铁,正好也有南北极,我们以此抽象。可以想象成一个盘面上布满了磁屑,那么这个盘面上就可以类似想象成布满了0,1信息,当我们写入数据的时候,磁头在盘面上进行寻址(盘面上是严格被划分的,读写都有各自指定的区域),找到对应的区域之后,通过磁头的放电行为,改变正负,就是写入0,1.

在磁盘工作下, 盘面转速是非常快的,几千或者上万转的都有,因此磁头和盘面是有一定的距离的,这个距离非常的接近。

2 磁盘在物理结构上如何存储数据

CHS寻址

每个盘面上都可以存储数据,每个盘面一圈圈的同心圆叫做磁道,以固定的角度切割磁道的同心圆,得到的叫做扇区。我们的文件存储的基本的单位就是扇区,一个扇区的大小是512字节

也就是说,我们可以通过盘面-》磁道-》扇区找到特定文件所在的扇区进行存取,这种寻址方式就叫做CHS寻址方式

3 从物理结构到抽象结构

 

LBA寻址

从抽象到线性存储

物理上是这么存储的,但是实际计算机中,我们把这样的结构抽象成一个大数组来进行存储。可以想象磁带,一圈一圈绕起来就是圆,但是展开就是对应的线性结构。那么我们磁盘也可以这样进行抽象。

在这样的一个大数组上,我们划分特定的盘面,磁道,扇区。

在这个数组里找到对应的区域的文件叫做LBA

这样我们就完成了物理结构抽象到线性存储的结构。

4管理

我们把磁盘抽象成了大数组之后就要实现对数组的管理了。由于数组的空间太大,不方便管理,因此我们可以对数组进行划分,划分成多个分区,每一个分区中又有多个块组。我们只要实现对一个块组的管理,就可以实现对一个分区的管理了。如果我们实现对一个分区的管理,将这种管理经验拷贝复制给其他的分区,就可以实现对磁盘的管理了。这就是分治思想的一个体现

二 块组

以一张图为例子

 一个分区大概是这样子的

boot block

是保存着一些开机项的一些信息,一般每个分区都有一份,因为当你某个分区中的boot block被损坏了,你还可以继续通过其他分区的这个东西来进行修复。

super block

整个文件系统的信息

 文件系统的核心数据块,代表文件系统本身。代表所有分区有多少个块组,哪些已经满了,哪些已经被占用了,inode有多少个,有多少个没有使用,还剩多少个……他是整个分区属性的属性集

为什么把整个文件系统的放到这里呢?磁盘磁头可能会和盘片碰撞,导致数据丢失,那么分区的使用情况就无法得知了,因此需要对分区属性做备份 因此几乎所有的块组都有super block来备份。

一个文件包含文件的内容和文件的属性,也就是说要把一个文件存储起来就需要对文件的内容和属性进行存储。

inode table

inode table里面有很多inode,每一个文件对应一个inode,一般是128字节,inode其实相当于一个数据结构,里面存储着文件的属性信息。每一个文件有自己对应的inode编号。inode编号只在对应的分区内有效。inode中也存储着文件内容存储的信息(怎么存储)。也就是说,我们如果想对内容进行索引的话,可以找到文件的inode,inode会标识对应的data blocks中的块组占用情况,我们接下来就可以索引到对应的块组进行数据的存取了。

data blocks

文件的内容由data blocks进行存储,一个大小是4KB,8*512byte。也就是说即使一个文件的内容只有一个比特位,也需要占用到4KB大小。这里这样设计一方面考虑到IO,如果设计的太小了,那么就会进行多次IO,根据冯诺依曼体系结构,大大降低了整机的效率。

另一方面,硬件上的基本数据的存储单位是512byte,但是硬件的更新迭代是很快的,os层则相对来说比较稳定,因此在设计的时候,设计成4KB大小可以完成硬件和os层面的解耦合,也就是说将来即使硬件更新迭代了,OS层也不需要发生多大的变化。

另外,data blocks中既可以存储文件的内容,也可以存储data blocks相对位置的信息。这是因为如果一个文件特别大的话,无法存储下。前十二个块用来存储文件的信息,后几个块用来存储对应的位置的信息,我们知道,一个块的基本大小是4KB,一个int是4bit,也就是说,我们可以在一个块中保存大量的文件的位置信息,通过间接诶索引的方式,找到对应的文件的内容。由于这个块中还会存储其他块组的位置信息或者文件信息,所以这里是一棵多叉树的结构。

有时候会出现这样的情况,可能我的系统里面还有空间却无法创建文件。有可能是inode table中还有空余的位置,但是data blocks已经满了,所以无法创建文件的内容了。也有可能反之,那么我们直接连文件的inode都无法申请下来

 

为了对文件更好地进行管理,对应的有两个结构,两个bit map,位图,用来管理文件的内容和属性信息。

block bitmap

Block Bitmap是用来管理内容的,Inode Bitmap是用来管理属性的。位图原理是这样子的,由于data blocks和inode table中的inode的相对位置是确定的,因此一个位图可以保存多个比特位,每一个比特位就用来标识对应的数据或者属性块的位置信息,如果这个块被占用,相应的bitmap就会被设置成1,如果没有被占用,就是0,标识可用。



GDT:Global Descriptor Table 块组描述符

有时候我们想了解一个分区中文件的情况,如果单纯地通过位图去了解的话,可能会比较慢,因此我们可以通过GDT,GDT就记录了总体的状况,有多少个Blocks Bitmap或者Inode Bitmap被占用,还有多少个可以用,总共有多少个……

我们了解这些就可以让一个文件的信息可以管理和追溯了

我们日常生活中所谓的格式化就是在对应的分区中划分成多个区域,每个区域有各自的功能,每个块组写入对应的管理数据。

三 文件名和目录之间的关系

我们平时在一个目录下创建一个文件,文件的名字是不能重复的,同时inode编号也是不能重复的,我们是不是可以推测,这两者之间有一定的关系?

平时用户是通过文件的名字来索引到对应的文件的,但是os是通过inode编号来标识对应的文件的,文件名是怎么存储的呢?存储在了哪里呢?不是存储在该文件的inode中,而是存储在该文件所在目录的data blocks中。他与文件的inode建立映射关系,一一对应。

Linux下一切皆文件,目录也可以类比文件存储。

那也就是说,我们要想找到对应的文件,就要知道他所在的目录。通过目录中data blocks中记录的信息来找到对应的文件的inode编号,通过inode编号来找到inode,知道了inode就可以知道文件对应的属性,其次inode中还存储着文件的内容的位置信息,知道了inode的同时也就知道了文件的内容。

我们平时找一个文件,应该要依托于文件的目录结构,通过目录的相对或者绝对路径找到UI赢得文件名。

因此我们就很容易和之前的目录权限进行联想了。

在一个目录下创建文件要w权限

创建文件需要给出文件名字吧,给出文件名字这个名字是在目录的data blocks中进行存储着的,因此我们需要对目录进行写入,写出文件对应的名字。

在一个目录下查看文件要r权限为什么

查看文件本质上是对文件的内容和属性进行读操作,在进行这个操作之前,我们需要找到对应的文件。我们如何找到对应的文件呢?通过唯一标识这个文件的文件名(对于用户来说),和inode编号。但是用户提供的文件名是在当前文件所在目录的data blocks中存储着的,因此我们需要拥有对目录的r权限,才可以在data blocks中获取对应的文件名

四 从底层看文件操作

创建文件实质上是干了什么

创建文件首先要知道在哪个目录下创建文件,在这个目录下就可以找到对应的分区了,根据文件系统的结构,找到目录的分区之后,目录所在的块组和也能找到。

创建文件的本质上用户输入touch file.c这样一个命令,提供了对应的文件名,OS在目录的data blocks中写入对应文件名,并且分配inode编号,文件名和inode编号建立映射关系,文件的属性如果用户没有特别指定的话,系统会有默认的属性分配给文件,通过inode编号找到inode,进行写操作,保存对应的属性信息,并且同时将对应位置的inode bitmap置为1;对文件的内容也是,遍历blocks bitmap,找到还没有被占用的比特位,置为1;通过inode进行索引,找到对应的块进行写入。这样文件的内容和属性就都被写入并且管理起来了

删除文件实质上是干了什么

文件的删除本质上单纯的只是将对应的blocks bitmap和inode bitmap的1的位置置为0,删除目录下的名字和inode编号所存在的映射关系。并没有对data blocks和inode table进行操作,因为没有必要。删除文件经历以上操作就可以完成了,接下来我们想对文件被删除的位置进行写入的话,直接覆盖式的写入就可以了。

由于删除比较简单,因此我们平时下载游戏视频的时候,所花的时间会比较长,但是删除通常只需要花费几秒钟。

并且由于是这样删除的,文件被误删其实是可以恢复的。恢复文件要做的其实就是找到对应被删除文件的inode编号,inode bitmap和blocks bitmap中的位置,有了inode bitmap中的位置,我们可以找到对应的inode,有了inode那我们就可以恢复文件的属性和内容了。当然,这么做的前提是,我被删除的文件没有被重新写入。

查看文件实质上是干了什么 

查看文件其实就是通过文件名,在对应的目录下找到inode编号,再根据inode编号找到对应的inode属性,我们就可以知道文件的属性了。inode又可以帮助我们索引到data blocks,我们就可以知道文件的内容了。

ls -a,就是将当前目录下的所有文件都通过这样的方式来展示出来

 五 软硬链接

本质区别:有无独立的inode 

软链接:

软链接有自己独立的inode,建立软链接的命令是 ln -s 之前的文件名 建立软链接的文件

 

那么就会出现一个指向之前文件的软链接的文件了,我们可以通过访问软链接的文件来访问之前的文件。

这个箭头可以理解成软链接的文件内容是指向对应文件的文件路径的

在lib64的库中有很多就是通过软链接建立联系的,我们可以将软链接理解成快捷方式

硬链接:

没有自己独立的inode,是一个独立的文件,和之前的文件共用一个inode。我们可以建立多个硬链接,建立硬链接的命令就是ln 不带s,之后和建立软链接是一样的

硬链接可以简单地理解成取别名

一个文件可以建立多个硬链接,当我们建立多个硬链接的时候,系统会根据你的硬链接数采用引用计数的方式来计算你有多少个硬链接数。(inode中有一个count来计算)删除一个硬链接就是删除了一个别名,对应的引用计数--,当引用计数为0的时候,也就代表这个文件被删除了,所以日常生活中我们除了可以用rm删除,也可以用unlink删除

一般来说,默认的文件带一个硬链接数,就是它本身

 

 

默认的一个目录带两个硬链接数,. 和..,代表他本身和他的上级目录。因此我们平时的.就是进入当前目录,..操作就是回退到上级目录

 

如果在一个文件目录下再创建一个目录,此时的硬链接数是3

 

我们可以根据目录的硬链接数大致估算这个目录下有多少个文件

比如这里带1个,3-2(减掉自己本身的和上机目录的)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/3307.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

网课查题接口搭建

网课查题接口搭建 本平台优点: 多题库查题、独立后台、响应速度快、全网平台可查、功能最全! 1.想要给自己的公众号获得查题接口,只需要两步! 2.题库: 查题校园题库:查题校园题库后台(点击跳…

字符串匹配算法(C/Java实现)

目录BF算法C语言实现Java实现KMP算法Java实现C语言实现next[]数组的优化BF算法 BF算法,即暴力(Brute Force)算法,是普通的模式匹配算法,BF算法的思想就是将目标串S的第一个字符与模式串T的第一个字符进行匹配,若相等,…

R语言代做实现:混合正态分布EM最大期望估计法

全文链接:http://tecdat.cn/?p4815 原文出处:拓端数据部落公众号 因为近期在分析数据时用到了EM最大期望估计法这个算法,在参数估计中也用到的比较多。然而,发现国内在R软件上实现高斯混合分布的EM的实例并不多,大多…

Linux系统下实现开机自动加载驱动模块

在使用模块化加载驱动时,若系统内部存在同类别设备驱动,可能会出现无法加载我们添加的动态模块,比如Linux系统内置了CDC驱动,当我们使用兼容CDC和VCP驱动USB转串口芯片时,就会出现上电出现的是CDC串口,从而…

vue3 组件响应式v-model 失效,实践踩坑,一文搞懂组件响应式原理,对初学者友好

文章目录前情提要实战解析最后前情提要 vue3的v-model已经有了变化,假如你还不知道其中细节,看完这篇文章你就完全明白了,我以踩坑的场景来进行解析。起因是在我的项目中需要一个输入框组件,这个组件用来根据输入异步查询系统内已…

Python编程 基础数据类型

作者简介:一名在校计算机学生、每天分享Python的学习经验、和学习笔记。 座右铭:低头赶路,敬事如仪 个人主页:网络豆的主页​​​​​​ 目录 前言: 一.Python基础数据类型 1.为什么会有数据类型?&am…

公共云和私有云之间的区别

目前,越来越多的公司正在调整云服务来运行他们的应用程序。其实,有不同类型的云部署模型来满足客户的不同需求。云部署模型分为三种类型:公有云、私有云和混合云(公有云和私有云的混合)。在本文中,我们将对公共云和私有云之间的区…

【数据结构】单链表——单链表的定义及基本操作的实现(头插、尾插、头删、尾删、任意位置的插入与删除)

🧑‍💻作者: 情话0.0 📝专栏:《数据结构》 👦个人简介:一名双非编程菜鸟,在这里分享自己的编程学习笔记,欢迎大家的指正与点赞,谢谢! 单链表前言…

分享30个PHP源码,总有一款适合你

链接:https://pan.baidu.com/s/1dVbUn5YFMOze4J-K8sCAXQ?pwdeinu 提取码:einu 下面是文件的名字,我放了一些图片,文章里不是所有的图主要是放不下...,大家下载后可以看到。 Emlog for SAE 适合新浪sae使用的个人博客…

网关Gateway-快速上手

gateway网关官方文档: https://docs.spring.io/spring-cloud-gateway/docs/current/reference/html/# 网关的概念 网关作为流量的入口,常用的功能包括路由转发,权限校验,限流等。 Spring Cloud Gateway 是Spring Cloud官方推出的第二代网关…

Java:修改Jar的源码,并上传Nexus私有仓库,替换jar版本

第一步:修改jar包源代码 建一个全类名一模一样的类,然后把要修改的类的代码复制过去,然后编译生成class。然后拿编译后的class覆盖到jar中对应的位置 第二步:上传nexus jar文件,pom文件:在本地仓库中可以…

Linux操作系统~进程有哪些状态?

目录 R状态 S/D状态 什么是D状态 T状态 X状态 Z状态 什么是等待队列,什么是运行队列,什么是挂起/阻塞,什么叫唤醒进程 对比宏观上操作系统的三种状态 从操作系统宏观的概念上讲,进程有三种状态,就绪态&#xff0…

自动化测试和测试自动化你分的清楚吗?

目录 前言 两种自动化测试 为什么测试自动化对连续测试至关重要 使测试自动化成为现实 拥抱连续测试 总结 重点:配套学习资料和视频教学 前言 当我们谈论持续测试,以及持续交付和DevOps时,“自动化”一词就泛滥了。从根本上讲&#xf…

ES6之对象解构

对象和数组字面量是JavaScript中两种最常用的数据结构,由于JSON数据格式的普及,二者已经成为语言中最重要的一部分。在代码中,我们经常定义很多对象和数组,然后从去提取相关的信息片段,ES6为简化这种任务引入了新特性&…

猿代码浅谈MPI与OpenMP并行程序设计

一、什么是OpenMP? OpenMP是一种用于共享内存并行系统的多线程程序设计的库(Compiler Directive),特别适合于多核CPU上的并行程序开发设计。它支持的语言包括:C语言、C、Fortran;不过,用以上这些语言进行程序开发时,并非需要特别…

一文读懂qt界面设计(分裂器,布局,拉伸,各种属性设置)

可以先看看我这个文章:qt关于界面设计中的一些知识总结_我是标同学的博客-CSDN博客_qt 水平伸展 现在我们来正式开始讲解。 布局种类 qt中能称为布局管理器的有如下6个: 水平布局(QHBoxLayout)垂直布局(QVBoxLayout…

数字电路基础04(查找表LUT)

文章目录 LUT(Look Up Table)为什么要用LUT?示例(3输入LUT)LUT(Look Up Table) 在FPGA中,利用LUT来实现组合逻辑的功能,将组合逻辑的输入输出结果,存储为真值表的形式,来代替传统的由逻辑门组成的组合逻辑电路LUT就是将组合逻辑转换成真值表LUT实际上是将输入数据作…

怎么清理c盘的垃圾文件?有什么好的清理方法推荐?

在使用电脑办公或者娱乐的时候,我们的电脑会产生很多临时文件,如果这些临时文件不被清理掉的话,就会导致电脑的运行速度越来越慢,为了能够让电脑的速度越来越快,很多人都会想要清理C盘,但是在清理C盘的时候…

机器视觉(三):摄像机标定技术

目录: 机器视觉(二):机器视觉硬件技术 机器视觉(三):摄像机标定技术 🌏🧐以下为正文🦄🪐 摄像机标定的目的:三维重建 空间物体表面…

ESP32使用MiroPython编程环境搭建

大家好! 今天和大家聊一聊ESP32使用MrioPython编程的环境搭建过程。 目录 一、在ESP32上使用MiroPython的必要条件 二、安装Thonny 1.安装地址 2.安装过程 三、下载MiroPython 四、下载ESP32驱动 五、烧录MicroPython到ESP32 六、点亮ESP32设备LED灯 一、在…