一、文件系统
1.1 文件系统的层次结构
- 用户需要通过操作系统提供的接口发出上述请求——用户接口
- 由于用户提供的是文件的存放路径,因此需要操作系统一层一层地查找目录,找到对应的目录项——文件目录系统
- 不同的用户对文件有不同的操作权限,因此为了保证安全,需要检查用户是否有访问权限——存取控制模块(存取控制验证层)
- 验证了用户的访问权限之后,需要把用户提供的“记录号”转变为对应的逻辑地址——逻辑文件系统与文件信息缓冲区
- 知道了目标记录对应的逻辑地址后,还需要转换成实际的物理地址——物理文件系统
- 要删除这条记录,必定要对磁盘设备发出请求——设备管理程序模块
- 删除这些记录后,会有一些盘块空闲,因此要将这些空闲盘块回收——辅助分配模块
1.2 文件系统的全局结构
- 原始磁盘 → 物理格式化 → 逻辑格式化 →
- 物理格式化,即低级格式化——划分扇区,检测坏扇区,并用备用扇区替换坏扇区
- 逻辑格式化后,磁盘分区(分卷 Volume),完成各分区的文件系统初始化(灰色部分就有实际数据了,白色部分还没有数据)
- open系统调用打开文件的过程
1.3 虚拟文件系统
- 虚拟文件系统的特点:
- 向上层用户进程提供统一标准的系统调用接口,屏蔽底层具体文件系统的实现差异
- VFS要求下层的文件系统必须实现某些规定的函数功能,如:open/read/write。一个新的文件系统想要在某操作系统上被使用,就必须满足该操作系统VFS的要求
- 每打开一个文件,VFS就在主存中新建一个 vnode,用统一的数据结构表示文件,无论该文件存储在哪个文件系统
- vnode 只存在于主存中,而 inode 既会被调入主存,也会在外存中存储
- 存在的问题:不同的文件系统,表示文件数据结构各不相同;打开文件后,其在内存中的表示就不同
1.4 文件系统挂载(mounting)
- 文件系统挂载(mounting),即文件系统安装/装载
- 文件系统挂载要做的事:
- 在VFS中注册新挂载的文件系统,**内存中的挂载表(mount table)**包含每个文件系统的相关信息,包括文件系统类型、容量大小等
- 新挂载的文件系统,要向VFS提供一个函数地址列表
- 将新文件系统加到挂载点(mount point),也就是将新文件系统挂载在某个父目录下
二、磁盘
2.1 磁盘的结构
- 磁盘的基本概念
- 磁盘:磁盘的表面由一些磁性物质组成,可以用这些磁性物质来记录二进制数据
- 磁道:磁盘的盘面被划分成一个个磁道,这样的一个“圈”就是一个磁道。最内侧磁道上的扇区面积最小,因此数据密度最大
- 扇区:一个磁道又被划分成一个个扇区,每个扇区就是一个“磁盘块”。各个扇区存放的数据量相同
- 需要把“磁头”移动到想要读/写的扇区所在的磁道,磁盘会转起来,让目标扇区从磁头下面划过,才能完成对扇区的读/写操作
- 磁盘的物理地址:可用(柱面号,盘面号,扇区号)来定位任意一个“磁盘块”(文件数据存放在外存中的几号块,这个块号就可以转换成(柱面号,盘面号,扇区号)的地址形式)
- 根据该地址读取一个“块”:
- 根据“柱面号”移动磁臂,让磁头指向指定柱面
- 激活指定盘面对应的磁头
- 磁盘旋转的过程中,指定的扇区会从磁头下面划过,这样就完成了对指定扇区的读/写
- 磁盘的分类
- 盘头可否移动:活动头磁盘、固定头磁盘
- 盘片能否更换:可换盘磁盘、固定盘磁盘
2.2 磁盘调度算法
2.2.1 一次磁盘读/写操作需要的时间
- 寻找时间(寻道时间)TS:在读/写数据前,将磁头移动到指定磁道所花的时间
- 启动磁头臂是需要时间的,假设耗时为 s
- 移动磁头也是需要时间的,假设磁头匀速移动,每跨越一个磁道耗时为 m,总共需要跨越 n 条磁道。则:寻道时间 TS = s + m*n(现在的硬盘移动一个磁道大约需要0.2ms,磁臂启动时间约为2ms)
- 延迟时间TR:通过旋转磁盘,使磁头定位到目标扇区所需要的时间。设磁盘转速为 r (单位:转/秒,或 转/分),则平均所需的延迟时间 TR = (1/2)*(1/r) = 1/2r(1/r 就是转一圈需要的时间,找到目标扇区平均需要转半圈,因此再乘以 1/2)
- 传输时间Tt:从磁盘读出或向磁盘写入数据所经历的时间,假设磁盘转速为 r,此次读/写的字节数为 b,每个磁道上的字节数为 N。则:传输时间Tt = (1/r) * (b/N) = b/(rN)
- 延迟时间和传输时间都与磁盘转速相关,且为线性相关;转速是硬件的固有属性,无法优化
- 操作系统的磁盘调度算法会影响寻道时间
- 总的平均存取时间 Ta = TS + 1/2r + b/(rN)
2.2.2 先来先服务算法FCFS
- 根据进程请求访问磁盘的先后顺序进行调度
- 优点:公平;如果请求访问的磁道比较集中的话,算法性能还算过的去
- 缺点:如果有大量进程竞争使用磁盘,请求访问的磁道很分散,则FCFS在性能上很差,寻道时间长
2.2.3 最短寻找时间优先SSTF
- SSTF 算法会优先处理的磁道是与当前磁头最近的磁道。可以保证每次的寻道时间最短,但是并不能保证总的寻道时间最短。(其实就是贪心算法的思想,只是选择眼前最优,但是总体未必最优)
- 优点:性能较好,平均寻道时间短
- 缺点:可能产生“饥饿”现象
2.2.4 扫描算法SCAN电梯算法
- 扫描算法(SCAN):只有磁头移动到最外侧磁道的时候才能往内移动,移动到最内侧磁道的时候才能往外移动
- 由于磁头移动的方式很像电梯,因此也叫电梯算法
- 优点:性能较好,平均寻道时间较短,不会产生饥饿现象
- 缺点:
- 只有到达最边上的磁道时才能改变磁头移动方向
- SCAN算法对于各个位置磁道的响应频率不平均
2.2.5 LOOK调度算法
- LOOK 调度算法:如果在磁头移动方向上已经没有别的请求,就可以立即改变磁头移动方向(边移动边观察,因此叫 LOOK)
- 优点:比起 SCAN 算法来,不需要每次都移动到最外侧或最内侧才改变磁头方向,使寻道时间进一步缩短
2.2.6 循环扫描算法C-SCAN
- C-SCAN 算法:只有磁头朝某个特定方向移动时才处理磁道访问请求,而返回时直接快速移动至起始端而不处理任何请
求 - 优点:比起SCAN 来,对于各个位置磁道的响应频率很平均
- 缺点:
- 只有到达最边上的磁道时才能改变磁头移动方向;并且,磁头返回时并不一定需要返回到最边缘的磁道
- 另外,比起SCAN算法来,平均寻道时间更长。
2.2.7 C-LOOK调度算法
- C-LOOK 算法:如果磁头移动的方向上已经没有磁道访问请求了,就可以立即让磁头返回,并且磁头只需要返回到有磁道访问请求的位置即可
- 优点:比起 C-SCAN 算法来,不需要每次都移动到最外侧或最内侧才改变磁头方向,使寻道时间进一步缩短
2.3 减少延迟时间的方法
- 延迟时间:将目标扇区转到磁头下面所花的时间
- 磁头读入一个扇区数据后需要一小段时间处理,如果逻辑上相邻的扇区在物理上也相邻,则读入几个连续的逻辑扇区,可能需要很长的“延迟时间”
2.3.1 交替编号、错位命名
- 若采用**交替编号**的策略,即让逻辑上相邻的扇区在物理上有一定的间隔,可以使读取连续的逻辑扇区所需要的延迟时间更小
- 采用**错位命名法**,因此读取完磁盘块(000, 00, 111)之后,还有一段时间处理,当(000, 01, 000)第一次划过1号盘面的磁头下方时,就可以直接读取数据。从而减少了延迟时间
2.3.2 磁盘地址结构的设计
- 为什么磁盘的物理地址是(柱面号,盘面号,扇区号)而不是(盘面号,柱面号,扇区号)?
- 答:若物理地址结构是(柱面号,盘面号,扇区号),且需要连续读取物理地址 (000, 00, 000)~(000, 01, 111)的扇区:(000, 00, 000) ~( 000, 00, 111 ) 由盘面0的磁头读入数据之后再读取物理地址相邻的区域,即(000, 01, 000) ~( 000, 01, 111 ),由于柱面号/磁道号相同,只是盘面号不同,因此不需要移动磁头臂,只需要激活相邻盘面的磁头即可。
2.4 磁盘的管理
2.4.1 磁盘初始化
- 进行低级格式化(物理格式化),将磁盘的各个磁道划分为扇区。一个扇区通常可分为 头、数据区域、尾 三个部分组成。管理扇区所需要的各种数据结构一般存放在头、尾两个部分,包括扇区校验码(如奇偶校验、CRC循环冗余校验码等,校验码用于校验扇区中的数据是否发生错误)
- 将磁盘分区,每个分区由若干柱面组成(即分为我们熟悉的 C盘、D盘、E盘)
- 进行逻辑格式化,创建文件系统。包括创建文件系统的根目录、初始化存储空间管理所用的数据结构(如 位示图、空闲分区表)
2.4.2 引导块
- 计算机开机时需要进行一系列初始化的工作,通过执行**初始化程序(自举程序)**完成;初始化程序可以放在ROM (只读存储器)中,ROM中的数据在出厂时就写入了,并且以后不能再修改
- 完整的自举程序放在磁盘的启动块(即引导块/启动分区)上,启动块位于磁盘的固定位置
- 拥有启动分区的磁盘称为启动磁盘或系统磁盘(C:盘)
- ROM中只存放很小的“自举装入程序”,开机时计算机先运行“自举装入程序”,通过执行该程序就可找到引导块,并将完整的“自举程序”读入内存,完成初始化
2.4.3 坏块的管理
- 坏块:坏了、无法正常使用的扇区;属于硬件故障,操作系统是无法修复的。应该将坏块标记出来,以免错误地使用到它
- 简单的磁盘:逻辑格式化时(建立文件系统时)对整个磁盘进行坏块检查,标明哪些扇区是坏扇区,比如:在 FAT 表上标明。(在这种方式中,坏块对操作系统不透明)
- 复杂的磁盘:磁盘控制器(磁盘设备内部的一个硬件部件)会维护一个坏块链表,在磁盘出厂前进行低级格式化(物理格式化)时就将坏块链进行初始化
- 扇区备用:保留一些“备用扇区”,用于替换坏块;这种处理方式中,坏块对操作系统透明
2.5 固态硬盘SSD
- 机械硬盘 vs 固态硬盘
- 固态硬盘基于闪存技术,一个固态硬盘可能包含多个闪存芯片
- 系统对SSD的读/写以页为单位
- 写入数据时,若其他页上有数据则,将其他页的数据复制到另一个块上并写入;并擦除原块
- 优点:SSD读写速度快,随机访问性能高,用电路控制访问位置(机械硬盘通过移动磁臂旋转磁盘控制访问位置,有寻道时间和旋转延迟);安静无噪音、耐摔抗震、能耗低、造价更贵
- 磨损均衡技术:
- 动态磨损均衡:写入数据时,优先选择累计擦除次数少的新闪存块
- 静态磨损均衡:SSD监测并自动进行数据分配、迁移,让老旧的闪存块承担以读为主的储存任务,让较新的闪存块承担更多的写任务