【Linux】基础IO_文件系统

news2024/11/19 17:36:37

 环境:centos7.6,腾讯云服务器
Linux文章都放在了专栏:【Linux】欢迎支持订阅

相关文章推荐:

【Linux】冯.诺依曼体系结构与操作系统

【C/进阶】如何对文件进行读写(含二进制)操作?

【Linux】基础IO_文件操作

【Linux】基础IO_文件描述符与重定向


前言

在前文我们所讲的都是已经打开的文件,而没有被打开的文件又存储在哪里呢?又是如何进行管理的呢?事实上,没有被打开的文件存储在磁盘,称之为磁盘文件。磁盘的存在不仅仅是为了存储文件,还有后续能对文件进行快速定位以及读取和写入。而对于磁盘文件的管理,则离不开文件系统,本次文章将对此进行探讨。

磁盘的物理结构

磁盘是什么?

磁盘是一种存储数据的存储器,早期主要计算机使用的磁盘是软磁盘(软盘),而如今则主要使用硬磁盘(硬盘)。而如今市面上的硬盘主要有机械硬盘以及固态硬盘。两者各有优缺点。

  1. 机械硬盘容量大、价格便宜、但读取速度非常慢、个头还大(很多公司还在使用,因为成本低)
  2. 固态硬盘读取速度快、个头小、但是价格贵,且存储空间有限(当前我们的大多数计算机都是固态硬盘)这里我们所讲解的是机械硬盘,顾名思义,机械硬盘是我们计算机上的唯一一个机械设备

基本结构

机械硬盘的基本结构主要包含以下部分:

  • 盘片一片两面、每一面都可以存储数据、有一摞盘片
  • 磁头盘片每一面各有一个磁头,磁头负责盘面数据的读取
  • 传动轴:用来控制磁头的进退
  • 主轴:控制盘片的稳定旋转
  • ......

存储结构

物理存储结构

机械硬盘的逻辑结构主要分为磁道扇区拄面。(部分内容来源于:硬盘结构(机械硬盘和固态硬盘)详解)

  1. 磁道:每个盘片都在逻辑上有很多的不同半径的同心圆,最外面的同心圆就是 0 磁道。我们将每个同心圆称作磁道(注意,磁道只是逻辑结构,在盘面上并没有真正的同心圆)。
  2. 扇区:在磁盘上每个同心圆是磁道,从圆心向外呈放射状地产生分割线(扇骨),将每个磁道等分为若干弧段,每个弧段就是一个扇区。每个扇区的大小是固定的,为 512Byte扇区也是磁盘的最小存储单位。
  3. 柱面不同盘片中的相同磁道形成的一个圆柱。

数据的写入与读取:

扇区作为磁盘中存储的基本单元,大小为512byte。(一个文件的数据在存储时可能占用多个扇区)。所以我们在进行数据的写入和读取时,只需要定位到具体的扇区即可。而定位一个扇区,首先要定位该扇区在哪一个盘面上(由磁头定位,每一个面都有一个磁头),接着通过同心圆的半径,确定扇区所在的磁道,最后再通过扇区的编号,确定该扇区的具体位置。这种通过磁头、磁道、扇区编号来定位扇区的放法,称之为CHS定位法

磁盘的存储介质为磁性材料,我们知道计算机内的数据都是大量的0和1,而磁头则会将0和1这种电信号转化为磁信号,也就说机械硬盘是通过磁头对南北极的更改,来实现数据的读取与写入。当我们通过CHS定位到具体扇区时:

  • 向磁盘中写入数据N -> S (0->1)
  • 删除数据:S ->N (1->0)
  • 对数据的写入/删除 与读取的本质更改基本元素的南北极,读取南北极。

逻辑抽象

如上所说,如果OS能知道任意的CHS地址,就能访问任意一个扇区,但是OS内部并不是直接使用CHS定位法。

这是因为OS是一个用来对软硬件资源做管理的软件,而CHS定位法是磁盘作为硬件来使用的方法。由于硬件可能会随着时代的发展而不断改变,如果此时OS采用CHS,那么OS也要不断随着硬件的更新而更新。耦合度太高,成本太大。因此为了实现与硬件的解耦,OS采用一种新的定位方法---LBA逻辑块地址

如下图所示:将磁道从最外层铺开,就像扯胶带一样拉开,就会得到一串连续的线性的空间,我们把它想象成一个大数组,如下图所示:

此时计算机的常规访问方式,就变成了某一个数据块的起始地址+偏移量。此时也就完成了CHS到BA的转换。因此,OS对于磁盘的管理,实际上就转化为了对这个大数组的管理。

当然,OS进行IO的基本单位是可以进行调整的,一般都是4KB,即一个数据块的大小,这也是为什么磁盘会被称之为块设备的原因之一。这样也是为了提高IO效率,根据内存对齐原则。

文件系统

分治管理

Windows下的分盘

我们目前所使用的计算机,实际上只有一个盘,那么为什么我们还要将它分成C盘、D盘呢?答案是为了让我们能更好的管理这些资源。同样,Linux操作系统为了更好的管理整个磁盘空间,也会对磁盘进行分区,对OS来说,管理好一个分区,就能管理好所有的分区(每一个分区的管理方法都一样),而为了更好的管理一个分区,又会在该区内进行分组管理,再次细分为一个一个块组。同样,管理好一个块组,即可管理好整个块组,进而管理好整个分区,实现对整个文件系统的管理。

 这种管理策略,有点类似于我们国内为了管理好整个国家,设置了各个省,而为了管理好一个省,又设置了各个市。只不过计算机的这种管理方式要更加简单些,因为管理的策略都一样,不像国内各个省市的管理要考虑当地具体情况。

块组内的信息

如上所说,OS只需要管理好一个块组,就能管理好所有的块组,进而管理好一个分区,再进而管理好整个文件系统。那么,一个块组内,都包含些什么呢?如下所示:

上面提到了一个inode节点,我们知道,Linux下一切皆文件,文件=内容+属性Linux是将文件的内容与属性的数据分离开来,一个inode节点内,保存文件的各种属性信息,比如:文件的读写权限、拥有者、文件大小、对应的inode编号等。而文件的内容数据,则保存在date blocks中对应的一个或多个数据块中。

这里需要注意的是:

  • 在文件的inode中,不包含文件名
  • 目录也是文件,也有自己的inode编号,其中目录的数据块中存放的则是该目录下的文件名与对应的inode编号的映射关系。两者互为Key值。
  • inode编号只在该分组所在的分区内有效。通过inode编号,就可以先确定所在分区,再确定所在分组。
  • 一个文件对应一个inode编号。任何文件,都在处于一个目录内。所以可以先通过inode Table找到目录的inode编号,找到inode编号,就找到了inode节点,节点内记载着各种属性,进而找到Block Bitmap的使用情况,根据Block Bitmap再来确定目录所使用的数据块,目录的数据块内包含目录下的文件名与文件的inode编号的映射关系,从而找到目录下的某一个具体文件。

我们通过指令ls -l -i查看文件的inode编号

磁盘文件的创建与删除

文件创建

  1. 对于文件的创建,首先会找到一个空闲的inode节点,将文件属性记录在该节点内,同时将该inode节点对应的inode Bitmap的比特位由0置1
  2. 寻找空闲的数据块,用来存储文件的相关内容,并将数据块的相关信息填入inode节点中,同时将对应的BlockBitmap由0置1
  3. 将该文件名添加到当前目录文件的Dateblock中,并将该文件名与对应的inode编号连接起来。

文件删除

  • 文件的删除,其实只需要对位图信息进行修改即可
  • 首先根据文件所在的目录。目录中的dateBlock记载着该目录下的文件名与inode编号的映射关系,根据映射关系,找到该文件对应的inode
  • 根据inode,将对应的BlockBitmap由1置0(删除内容)
  • 再根据inode,将对应的inodeBitmap由1置0。(删除属性)

也就是说,假如我们的文件被误删除的话,是有一定希望可以进行恢复,只需要将该文件的inode编号对应的位图信息由0恢复成1即可。当然,这种恢复技术还是由专业人员来进行操作,我们只要保证删除文件的inode编号不被其它文件使用即可。

对于其它的一些补充

补充一、

我们知道,在文件的inode节点中,记载了数据块的相关使用信息,可能是用一个数组来记载,但是此时可能会面临一个问题,就是假如一个文件使用了15个数据块,而一个数据块的大小为4kb,也是不是意味着该文件最多能放入15*4=60kb的内容?

答案是否定的,因为数据块里面有的可能并不是放着文件的内容,而是存放着该文件使用的其它数据块的索引。(有点类似套娃)如下所示:

 如上所示,一个数据块内,可能存在多级的索引关系,从而实现对大量数据的存储。

补充二、

如上所说,文件的内容采用数据块存储,而一个数据块的大小为4kb,那么就可能会出现文件系统中存在大量的,内容非常少导致实际使用的空间很小(可能才几个字节,甚至更小),此时就会出现大量的空间浪费。

实际上假如出现这种情况,确实会出现空间浪费的情况。但是为什么我们不选择将数据块大小设置为1kb呢?实际上这样做虽然可以处理,但是对于大型文件,就会占用更多的数据块,inode也要记录更多的所使用的数据块情况。此时就可能造成文件系统读写性能不佳,定义成4kb的原因最主要还是由于普适性。并且如今的磁盘空间容量都比较大,所以一般都是采用4kb的大小来定义一个数据块。


end.

生活原本沉闷,但跑起来就会有风!🌹

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/502545.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【9种】ElasticSearch分词器详解,一文get!!!| 博学谷狂野架构师

ElasticSearch 分词器 作者: 博学谷狂野架构师GitHub:GitHub地址 (有我精心准备的130本电子书PDF) 只分享干货、不吹水,让我们一起加油!😄 概述 分词器的主要作用将用户输入的一段文本,按照一定…

二十一、线索转换1:点击转换按钮加载信息、搜索市场活动

功能需求 *在线索转换页面,展示:fullName,appellation,company,owner 流程图 代码实现 1.ClueMapper /*** 通过id查询线索详情* param id 线索id* return 对应id的线索*/Clue selectClueForDetailById(String id); ClueMapper.xml <select id"selectClueForDetailByI…

考研数学武忠祥 高等数学0基础课笔记

函数和映射 常见的函数 取整函数的基本性质 函数的有界性 例题 sinx 是从-1到1的&#xff0c;但是x是无界的 遇到这种带sin的&#xff0c;就要试着取特殊值&#xff0c;让它为1或者为0 函数的单调性 函数的奇偶性 函数的周期性 举例 数学中Q表示有理数集&#xff0c;下面…

Docker服务编排(Docker Compose) :部署上线nginx+springboot项目

Docker服务编排(Docker Compose) 微服务应用一般包含若干个微服务每个微服务一般会部署多个实例&#xff0c;如果每个微服务需要手动启停 维护工作量大 从Dockerfile build image 或者去dockerhub拉去image 创建多个容器 管理容器 Docker Compose 一个编排多容器分布式…

设计原则之【接口隔离原则】

文章目录 一、什么是接口隔离原则二、实例三、总结接口隔离原则与单一职责原则的区别 一、什么是接口隔离原则 接口隔离原则&#xff08;Interface Segregation Principle, ISP&#xff09;是指用多个专门的接口&#xff0c;而不使用单一的总接口&#xff0c;客户端不应该依赖…

自学Java多久可以就业?Java这样自学实习都能过万!

昨天有00后学妹私信小源&#xff0c;她在学校已经学过java、C等相关课程&#xff0c;未来想走计算机的方向&#xff0c;问我建议还要学习什么语言&#xff0c;是否需要继续学Java?今天好程序员简单介绍下Java必学的技术&#xff01;想自学Java的真的可以试一试&#xff01; 一…

哈希数据结构的概念、实现和应用

一、认识哈希表 1.unordered_set和unordered_map STL实现了两个数据结构unordered_map和unordered_set顾名思义&#xff0c;因为底层的实现方式不同&#xff0c;它们成为了无序的map和set&#xff0c;但是它们的使用与普通的map和set是一样的。 我们可以通过代码测试两种数据…

【力扣--622】设计循环队列

&#x1f58a;作者 : D. Star. &#x1f4d8;专栏 : 数据结构 &#x1f606;今日分享 : 丢脸其实并没有那么可怕&#xff0c;我们可以从另一个角度来想&#xff1a;别人能够记住我了&#xff0c;而且过了还有多少人能记得我呢&#xff1f;虽然这种出场不太优雅&#x1f606; 设…

python制作散点动图

目录 示例1&#xff1a;简单的散点图示例2&#xff1a;添加颜色和大小示例3&#xff1a;实时更新动图完整代码 本教程将介绍如何使用Python制作散点动图。我们将通过三个示例代码&#xff0c;从易到难&#xff0c;逐步说明如何使用Python绘制出散点动图。 示例1&#xff1a;简单…

图书馆客流人数统计分析系统方案

智慧客流人数统计分析系统可以帮助图书馆管理者更好地管理人群流量。系统能够自动统计区域内的人流量高峰期&#xff0c;并通过数据分析提供更加合理的管控&#xff0c;从而提区域内人群流动性&#xff0c;避免拥堵的情况。 AI客流视觉监控 客流量管控分析系统意义 讯鹏客流量管…

雪花算法生成ID

1.简介 SnowFlake 中文意思为雪花&#xff0c;故称为雪花算法。最早是 Twitter 公司在其内部用于分布式环境下生成唯一 ID。在2014年开源 scala 语言版本。 雪花算法的原理就是生成一个的 64 位比特位的 long 类型的唯一 id。 最高 1 位固定值 0&#xff0c;因为生成的 id 是…

Python的HTTP库及示例

13.3 HTTP库 HTTP&#xff08;Hyper Text Transfer Protocol&#xff09;是一个客户端和服务器端请求和应答的标准。客户端是终端用户&#xff0c;服务器端是网站。客户端发起一个到服务器上指定端口的HTTP请求&#xff0c;服务器向客户端发回一个状态行和响应的消息。 可以…

ICV: 2025年全球QKD产业规模有望达到25亿美元

近日&#xff0c;专注于量子、智能驾驶等前沿科技领域的国际咨询机构ICV发布了《全球量子安全通信产业研究报告》&#xff0c;报告主要内容包括量子安全通信的概念、量子密钥分发 (QKD)发展历程、QKD的优势、产业链、应用领域、QKD产业规模及预测、全球主要参与者。 量子安全通…

ubuntu18.04中PCL点云库依赖的安装以及PCL点云库和Eigen的卸载与安装

一、PCL点云库依赖的安装、遇到问题的解决方法 sudo add-apt-repository ppa:v-launchpad-jochen-sprickerhof-de/pcl sudo apt-get update sudo apt-get install libpcl-all 以上是官方给出的&#xff0c;但是会出很多报错&#xff0c;这里建议自己配置。 配置步骤&#xff…

【Android学习专题】安卓样式学习(学习内容记录)

学习记录内容来自《Android编程权威指南&#xff08;第三版&#xff09;》 样式调整和添加 调整颜色资源&#xff08;res/values/colors.xml&#xff09; 格式&#xff1a; 添加样式&#xff08;res/values/styles.xml&#xff09;&#xff0c;&#xff08;创建BeatBox项目时…

开源狂潮让巨头惨败!谷歌内部文件曝光:我们和OpenAI都没有护城河

因为开源&#xff0c;AI军备竞赛&#xff0c;谷歌和OpenAI全是输家&#xff1f; 来源丨新智元 重磅&#xff01; 谷歌的一份名为《我们没有护城河&#xff0c;OpenAI也没有》的内部文件疑似被泄露&#xff0c; 今天早上&#xff0c;外媒SemiAnalysis公布了这份重磅炸弹泄露…

日撸 Java 三百行day45

文章目录 说明day45 冒泡排序1. 基本思路2.代码 说明 闵老师的文章链接&#xff1a; 日撸 Java 三百行&#xff08;总述&#xff09;_minfanphd的博客-CSDN博客 自己也把手敲的代码放在了github上维护&#xff1a;https://github.com/fulisha-ok/sampledata day45 冒泡排序 …

IP地址技术原理

IP地址用于唯一地标识一个网络设备&#xff08;如计算机、路由器等&#xff09;在互联网或局域网中的位置。IP地址由32位二进制数表示&#xff0c;通常分为4个8位二进制数&#xff0c;每个数用点号隔开&#xff0c;如106.110.92.215。IP地址可用于数据传输、网络管理和安全控制…

Springboot +Flowable,服务任务ServiceTask执行的三种方式(一)

一.简介 ServiceTask 从名字上看就是服务任务&#xff0c;它的图标是像下面这样&#xff0c;截图如下&#xff1a; ServiceTask 一般由系统自动完成&#xff0c;当流程走到这一步的时候&#xff0c;不会自动停下来&#xff0c;而是会去执行我们提前在 ServiceTask 中配置好的…

托福高频真词List06 // 附阅读真题 14:26~15:12 // 15:12~16:12

目录 生词 熟词 阅读真题 生词 inducecausecause the formation of increasestimulate&#xff08;导致&#xff09; v 导致 inevitableunavoidable certainnecessary&#xff08;不可避免地&#xff09; adj 不可避免的accommodateallowv 顺应 modestreasonablesmall modera…