1. 文件系统的引出
在之前的学习过程当中,我们知道当文件被打开后需要加载进内存,第一步为其创建struct file结构体描述其结构(操作系统需要管理被打开的文件:先描述再组织),在通过进程当中的文件描述符指针指向文件描述符表,根据文件描述符的分配规则给新打开的文件分配文件描述符,那么此时进程就通过文件描述符和文件建立起联系。
进程与文件关系的博客链接
当我们进行文件操作时,例如写入文件就需要先将数据拷贝进C语言封装的文件缓冲区,再拷贝进内核缓冲区,最后再写入到外设(磁盘)当中…
文件缓冲区的博客链接
而以上这些操作都是进程与被打开文件之间的关系,那么对于未打开的文件,操作系统是不是也需要进行管理操作呢?
没有被打开的文件都只能安静的在磁盘上存放着,磁盘上存在大量文件需要被OS静态管理起来,方便我们随时打开 – 这就是文件系统的作用
2. 硬件结构的学习
在详细描述文件系统之前,需要我们对硬件有一定程度的了解,下面咱们就来简单认识一下吧!!!
2.1 磁盘的物理结构
目前在笔记本当中已经很少见到使用磁盘来作为存储结构了,大多数都是固态硬盘(同等存储量固态硬盘的价格要高于机械硬盘,固态硬盘的访问速度更快)
但是在企业当中还是通常使用磁盘来作为数据存储的主流,因为固态硬盘还存在访问次数的限制(访问次数过多可能会造成击穿现象)
而且磁盘的造价更低
磁盘是属于计算机结构当中的唯一一个机械结构!!!
而且磁盘是外设,这二者结合起来导致硬盘的访问速度非常低(跟CPU相较而言)
盘面此时在高速旋转,磁头也在不停摆动
但是盘面和磁头不接触(盘面上存储的就是大量的数据,一旦磁头和盘面进行接触,可能会刮花盘面,导致数据丢失)
可以通过小时候使用的光盘来理解,光盘只有一面有数据,一旦刮花光盘播放起来就很卡(掉帧 – 数据丢失)
所以,磁盘对无尘环境的要求很高,一旦出现灰尘与盘面或者磁头发生碰撞,都可能导致磁盘的损坏
2.2 磁盘的存储结构
磁盘的盘面的转速很快,通常可能达到1w转1s,这么快的标准是什么,需要让磁头快速定位到磁道和扇区,在单位时间内(非常短:1s/1w)将该扇区的数据全部读出
2.3 磁盘的逻辑结构
为何OS要对磁盘进行逻辑抽象呢?直接用CHS寻址不行吗?
- 方便管理
- 不想让操作系统的代码和硬件强耦合(当磁盘切换成固态硬盘,这套管理方法也能适用,但是CHS就不行啦!)
虽然对应的磁盘访问的基本单位(扇区)是512字节,但是依旧很小,OS内的文件系统定制的进行多个扇区的读取都是以1KB或者2KB或者4KB(通常是以4KB)为基本单位。即便你只是单纯的想要读取或者修改1个比特位,也必须将4KB的空间加载进内存进行读取或者修改,再重新将这些数据写回磁盘
那么这种写入方式不是非常浪费内存空间吗?为啥操作系统会这样操作呢?
因为局部性原理的原因:
局部性原理是指CPU访问存储器时,无论是存取指令还是存取数据,所访问的存储单元都趋于聚集在一个较小的连续区域中。通俗来讲,就是CPU访问该字节,那么极大概率会访问该字节前后的数据
所以,直接将这一块的数据全部加载进内存也能提高CPU访问数据的效率
内存是被划分成为4KB大小空间(页框) 磁盘当中的文件尤其是可执行文件也是按照4KB大小来划分的(页帧)
3. 文件系统
创建/删除文件操作
创建文件:1. 在inode位图结构当中将对应的比特位由0置1,根据inode找到inode table ,将文件的属性填入。
2. 将数据写入data block当中,建立inode和data block的映射关系
3. 最后返回inode编号
删除文件:1. 找到inode编号在inode bitmap当中的位置将其由1置0即可,数据块当中的bitmap位置也由1置0(惰性删除)
删除后恢复
文件删除后是可以恢复的,只需要将inode编号得到,将inode bitmap当中的比特位由0置1,再找到inode和数据块之间的映射关系
将data block中的比特位由0置1… 但是Linux当中恢复文件比较复杂
(不小心误删文件,什么都别做 再新建写入文件就真正删除)
目录也是文件
当我们自己在使用shell时,查找文件都是使用文件名,并不是inode ,文件名和inode之间存在什么关系嘛?
任何一个文件肯定在目录下,同样的,目录也是文件,也必然存在inode(文件属性)和数据块
目录的数据块当中存放什么内容呢?
目录里面存放的是文件名和inode的映射关系!!!
所以,我们在日常过程中使用ls,一定是查找当前目录下的数据块当中文件名,将inode和文件名之间的映射关系提取出来
同一目录下不能存在同名文件,文件名在当前目录下就属于唯一key值,通过文件名就可以索引到inode
之前的学习过程中,要在目录下新建文件必须要有该目录的写入权限,这是为何?
因为要新建文件就必须要往该目录的数据块当中写入文件名和inode的映射关系
创建一个新文件主要有一下4个操作:
- 存储属性
内核先找到一个空闲的i节点(这里是263466)。内核把文件信息记录到其中。 - 存储数据
该文件需要存储在三个磁盘块,内核找到了三个空闲块:300,500,800。将内核缓冲区的第一块数据
复制到300,下一块复制到500,以此类推。 - 记录分配情况
文件内容按顺序300,500,800存放。内核在inode上的磁盘分布区记录了上述块列表。 - 添加文件名到目录
新的文件名abc。linux如何在当前的目录中记录这个文件?内核将入口(263466,abc)添加到目录文
件。文件名和inode之间的对应关系将文件名和文件的内容及属性连接起来。
4. 软硬链接