关键问题:如何存储和访问磁盘上的数据
现代磁盘驱动器如何存储数据?接口是什么?数据是如何安排和访问的?磁盘调度如何提高性能?
1. 接口
驱动器制造商唯一保证的是单个512字节的写入是原子的,即它将完整地完成或者根本不会完成,因此,如果发生了不和时宜的掉电,则只能完成较大写入的一部分。
通常可以假设访问驱动器地址空间内两个彼此靠近的块将比访问两个相隔很远的块更快,人们通常可以假设访问连续块是最快的访问模式,并且通常比任何更随机的访问模式快得多。
2. 基本几何形状
3. 简单的磁盘驱动器
单磁道延迟——旋转延迟rotational delay, rotation delay:必须等待期待的扇区旋转到磁头下
多磁道延迟——寻道时间,驱动器将磁盘臂移动道正确的磁道的时间
完整的I/O时间图包括了:首先寻道,然后等待转动延迟,最后传输。
磁道偏斜,许多驱动器会采用这种方式,以确保即使在跨越磁道边界时,顺序读取也可以方便地服务
现代磁盘驱动器还有一个重要组成部分时缓存,也被称为磁道缓冲区
在写入数据时,驱动器面临一个选择:它应该将在数据放入其内存之后,还是写入实际写入磁盘之后回报写入完成?前者称为后写缓存(有时也称立即报告),后者则称为直写,前者往往更快,但可能有危险。
4. I/O时间:用数学
T_I/O = T_寻道 + T_旋转 + T_传输
I/O速率定义
R_I/O = 传输大小 / T_I/O
两种常见的负载:
- 随机工作负载,它向磁盘上随机位置发出小的读取请求
- 顺序工作负载,只是从磁盘连续读取大量扇区,不会跳过
随机和顺序工作负载之间的驱动性能差距很大
高端性能驱动器与低端容量驱动器之间的性能差异很大
5. 磁盘调度
由于I/O的高成本,操作系统在决定发送给磁盘I/O顺序方面来发挥作用。
与任务调度不同,每个任务的长度通常是不知道的,对于磁盘调度,我们可以很好地猜测任务(即磁盘请求)需要多长时间。磁盘调度程序将尝试在其操作中遵循SJF最短任务优先的原则。
SSTF:最短寻道时间优先,按磁道对I/O请求队列排序,选择在最近磁道上的请求先完成:操作系统可以使用最近块优先,Nearest-Block-First
但是这里有一个问题:饥饿问题,SSTF对磁道当前所在位置的内圈磁道有稳定的请求,而忽略对其他磁道对请求。
解决上面问题可以使用电梯算法,又称SCAN或C-SCAN,简单地以跨越磁道对顺序来服务磁盘请求,我们将一次跨越磁盘称为扫一遍。因此,如果请求的块所属的磁道在这次扫一遍已经服务过了,它就不会立即处理,而是排队等待下次扫一遍
SPTF:最短定位时间优先
- 寻道时间远远高于旋转延迟,那么SSTF或者变体就好了
- 查找和旋转大致相当,因此SPTF是有用的,它提高了性能
其他调度问题
- 在较早的系统中,操作系统完成了所有的调度
- 在现代系统中,操作系统调度程序通常会选择它认为最好的几个请求,并将它们全部发送到磁盘。磁盘然后利用其磁头位置和详细的磁道布局信息等内部知识,以最佳可能SPTF顺序服务于这些请求
- 磁盘调度程序执行的另一个重要的相关任务是I/O合并,可以降低开销,在向磁盘发出I/O之前系统应该等待多久?这是个复杂的问题