计算机上的易失和非易失存储器
常见磁盘可以分为两类:机械磁盘和固态磁盘。
第一类,机械磁盘,也称为硬盘驱动器(Hard Disk Driver),通常缩写为 HDD。机械磁
盘主要由盘片和读写磁头组成,数据就存储在盘片的环状磁道中。在读写数据前,需要移
动读写磁头,定位到数据所在的磁道,然后才能访问数据。
显然,如果 I/O 请求刚好连续,那就不需要磁道寻址,自然可以获得最佳性能。这其实就
是我们熟悉的,连续 I/O 的工作原理。与之相对应的,当然就是随机 I/O,它需要不停地
移动磁头,来定位数据位置,所以读写速度就会比较慢。
第二类,固态磁盘(Solid State Disk),通常缩写为 SSD,由固态电子元器件组成。固
态磁盘不需要磁道寻址,所以,不管是连续 I/O,还是随机 I/O 的性能,都比机械磁盘要
好得多。
最小读写单位
机械磁盘的最小读写单位是扇区,一般大小为 512 字节。
而固态磁盘的最小读写单位是页,通常大小是 4KB、8KB 等。
文件系统会把连续的扇区或页,组成逻辑块,然后以逻辑块作为最小单元来管理数
据。常见的逻辑块的大小是 4KB,也就是说,连续 8 个扇区,或者单独的一个页,都可以
组成一个逻辑块。
磁盘I/O原理
磁盘每个盘片为双面,每个面上分布一圈一圈的同心圆磁道,磁道由扇区组成。外围的扇区更宽,扇区的存储空间是一样的,一般每个扇区600字节,数据存储区512字节,其余存放控制信息。磁臂头移动遍历磁道,盘片旋转遍历扇区。
寻道时间:将磁臂头移动到指定磁道上所经历的时间
旋转延迟时间:盘片转动时扇区移动到磁头下所经历的时间
传输时间:将数据从磁盘读出或写入数据所经历的时间(与每次读/写的字节数和磁盘转速有关)
随机I/O:有一串随机数据文件(在磁盘上的位置分布随机的数据文件),需要从磁盘上一一读取。这样寻道时间很长,会导致I/O读取时间过长。
比如,在磁道2扇区3读取了第一个数据文件,接下来,磁头臂向外移动去磁道14扇区5读取第二个数据文件,接下来磁头臂又要向里移动到磁道8扇区4读取第三个数据文件,之前读取第二个数据文件时从磁道2移到14,现在又从磁道14移到8,可见这样重复走了8-14的磁道。可以知道,如果后面还有数据存在于走过的磁道上,会有很多的重复寻道,极大增加了寻道时间。
顺序I/O:就像是随机I/O的优化版,我们可以将我们要读取的数据文件按照其磁盘存放顺序排序,从第一个文件的位置开始向一个方向读取,我们依次读完每个磁道直到所有文件读取完,不必再有随机I/O带来的重复寻道时间。
在许多的开源框架如 Kafka、HBase 中,都通过追加写的方式来尽可能的将随机 I/O 转换为顺序 I/O,以此来降低寻址时间和旋转延时
什么是磁盘IO
IO就是 先从磁盘找到数据的位置,再将数据转换成数据流读到内存
先从磁盘找到数据的位置,将内存中的数据转换成数据流写到磁盘
IO消耗的时间(如下图)=磁盘访问时间=寻道时间+旋转延迟+传输时间