文章目录
- 磁盘的结构
- 磁盘的性能指标
- 磁盘阵列
- 固态硬盘SSD
- 关于机械硬盘和固态硬盘的地址
这里计算传输时间和数据传输率是难点
磁盘的结构
注:磁盘的基本读取单位是扇区,但是每次只能读取1bit,这里我们应该理解为磁盘每次的读写操作至少要持续一个扇区的范围,即原子性的,即磁盘的读取是串行的,然后先读取到缓冲区中,最后串行转并行。
磁盘的工作原理:通过磁头向磁盘上读写信息,可以将磁头简单理解为一个铁圈,通过施加电流的方式可以使磁头在磁盘上写入信息,也可以在磁头上读出信息,但是需要注意的是磁头每次只能读写1bit的信息。
机械硬盘:机械硬盘在同等容量下,比固态硬盘要便宜的,并且机械硬盘的寿命较长,因为使用的是磁性材料,所以基本不存在使用寿命的问题,但是也因为如此,机械硬盘需要受到环境的元素,可能会收到磁场的影响。
磁盘的组成:
一个机械磁盘由盘片,磁盘驱动器,磁盘控制器,盘片组成。
盘面:由多个盘片组成,一个盘片具有正反两面,每一面上都对应一个读写磁头。(从图中我们可以看出最上面的盘片和最下面的盘片的上面和下面是没有磁头的,原因是为了节省成本)。
磁道:盘片中一个同心圆称为一个磁道,一个磁道由若干个扇区组成。
扇区(块):磁道中类似扇面的一个小平面,是磁盘读写的最小单位,也就说磁盘每次会原子的写入或者读出至少一个扇区的内容。
柱面:不同盘片相同半径同心圆组成的面,柱面的个数说明了磁道的个数。
磁盘驱动器:可以简单理解为磁头摆臂,读写磁头,带动盘片选择的马达等组成
磁盘控制器:简单理解为磁盘和主机交互的接口,简单认为是一个控制电路就好,控制磁盘的正常运转,一个磁盘有一个控制器,常见的标准有IDE,SCSI,SATA。可以认为标准就是磁盘和主机进行交互的时候信息传输的速率,大小等标准。
磁盘的性能指标
( 1 ) (1) (1)磁盘容量
磁盘的容量:磁盘所能存储的字节总数称为磁盘的容量,磁盘的容量有非格式化容量和格式化容量之分。
非格式化容量:非格式化容量是理想情况下,即磁盘内部不花费空间装载文件系统,所有空间用来存储数据。非格式化容量就是磁盘理想状态下可用的最大容量
格式化容量:格式化容量是指磁盘装载了文件系统的前提下所能存储数据的容量。
( 2 ) (2) (2)记录密度
道密度:沿磁盘半径方向上单位长度的磁道个数
位密度:一个磁道每一个单位长度能够记录的二进制代码的的位数。
面密度:道密度和位密度的乘积
注:每个磁道含有的扇区的个数都是相同的,虽然看上去不同的扇区的大小不同,但是实际上每个扇区存储的数据都是相同的,这很好理解,因为磁盘的基本读取单位就是扇区,所以必须每个磁道的扇区大小都相同。但是这也造成了一个问题,即磁盘的容量受到内部磁道的限制,因为内部磁道毕竟是有限的,所以存储的数据也是有限的,所以内部磁道能存储的数据量对磁盘能够存取的数据量具有影响。因为外部磁道的存储量需要跟随内部磁道的存储量,但是外部磁道较大,所以外部磁道的位密度较小,内部磁道位密度较大,即每cm需要存储更多的数据。
注意,磁盘分为内半径和外半径,其中内半径是不能存储磁道的,所以需要及那个外半径减去内半径,剩下来的部分才能存储磁道。
(
3
)
(3)
(3)磁盘的平均存取时间
磁盘的平均存取时间一共由以下四个部分组成:
磁盘控制延迟时间:主机向磁盘发送命令的延迟时间
寻道时间:磁盘臂将磁头定位到对应磁道需要的时间(寻道时间一般比较长)
旋转延迟时间:磁头定位到对应扇区需要的时间
传输时间:磁头读取完扇区内的数据需要的时间
计算磁盘的存取时间的时候,由于寻找磁道和扇区的时间是不固定的,所以一般取平均值。
一般来说:存取时间大部分由寻道时间和旋转延迟时间组成。
注意:
寻道时间一般是磁头从最外面的磁道运动的最里面磁道需要时间的一半。
旋转延迟时间一般是取转1圈需要的时间的一半。
传输时间其实就是磁盘的传输速率。需要注意的是,磁盘传输速率
(
4
)
(4)
(4)数据传输率
数据传输率D:磁盘在单位时间内向主机传送的数据的字节数,就是数据传输率,这里的数据传输率我们应该更深理解,应该理解为每s磁头可以划过多少次磁道,滑过多少个扇区。单位时间内划过的磁道容量/扇区个数 X 扇区容量就是数据传输率。
如果给了我们转速和磁道的扇区个数:我们就能算出转一圈需要多少时间,然后通过磁道内的扇区数,我们就能够得出转一个扇区需要多少时间。所以说数据传输时间本质是是转过这么多扇区,磁道需要的时间!
每秒的数据传输率=磁道容量(扇区个数 X 扇区容量) X 每秒旋转的次数
对于数据传输率应该有更深刻的理解,数据传输率应该理解为,磁盘在单位时间内不断传输数据,单位时间内能够传输多少。这里我们应该忽略每次的寻道时间和旋转延迟时间等也就是说这里的单位时间是纯粹用来传输数据的时间,即一直传输,假设不需要寻道这些的,单位时间可以传输的量就是数据传输率。
磁盘转一圈需要的时间=时间/旋转的次数
磁盘每秒可以多少转=转数/60s。
主机是如何告诉磁盘自己想要读的扇区在什么位置的?
因为磁盘读取的基本单位是扇区,所以磁盘中的地址是相对扇区的位置来进行编址的。
电脑中可能有多个磁盘,所以需要说明是在哪一个磁盘,而一个磁盘具有一个驱动器,所以也可以指明是哪个驱动器。
需要注意的是:
假设主机告诉磁盘要写数据,然后主机通过总线将数据发送给磁盘,但是磁盘的写入是串行的,即每次只能写1bit。所以我们可以理解为在磁盘内部有一个写缓冲区用来暂时保存主机发送来的数据,然后磁盘的读写电路每次拿1bit的数据给磁盘进行写入。
将数据读取出也是相同的,因为磁盘最终传输的时候是通过总线将数据一起送给主机,但是因为磁盘每次只能读取1bit,所以我们可以理解为磁盘内部有一个读缓冲器,磁盘读取完的数据先放在读缓冲区,最后在读写电路的控制下并行的通过总线传输给主机。
注:磁盘的读写过程类似是互斥的,读的时候就不能写,写的时候就不能读。
机械磁盘在收到外部的控制指令后会将这些控制指令放到自己的缓冲区内,然后到缓冲区内逐一取指令执行指令,控制指令一般是寻址,读盘,写盘,又叫做控制字。
磁盘阵列
在这里插入图片描述
注意:一定要记住RAID是多个硬盘在逻辑上组成的,并且数据在多个硬盘上分叉存储,因为是不同的硬盘,实际上可以做到并行工作,提高了传输率和吞吐量。(这里需要注意理解,正因为是其交叉存储才提高了传输率和吞吐量),传输率和吞吐量都是时间而言的,通过RAID的多块盘交叉存储才能完成,如果是数据都存储在但快盘,就不可能有这样的效率了。
RAID是多块磁盘构成的磁盘整列:
通过磁盘间的协同工作,完成主机对数据的读写和存储。
冗余:即是否使用空间来存储备份信息
检验:对于传输的数据是否具有检验存储是否正确的能力
(
1
)
(1)
(1)RAID0
特征:空间都用来存储数据,不存储备份信息和检验信息。无冗余和无检验能力,数据丢失即丢失,存储错误也无法修正,没有容错能力
(
2
)
(2)
(2) RAID1 镜像盘
假设2块磁盘构成了一个RAID1,那么其中一个盘存储的数据和另一个盘完全相同。即n个盘,n/2盘都是拷贝。具有容错能力,可对数据进行修正或者找回丢失的数据
从RAID2开始,就开始采用海明校验码或者奇偶校验码来对数据进行保障。具有数据的修正能力和丢失找回能力,容错能力高。
(
3
)
(3)
(3)
(
4
)
(4)
(4)
(
5
)
(5)
(5)
注:RAID就类似低位交叉编址,相邻的数据放在不同的磁盘里。因为磁盘是一个独立的个体,所以和低位交叉编制不同,将数据放在不同的磁盘,可以做到磁盘的数据的并行处理,即主机同一时刻处理多个磁盘指挥进行数据的处理,速度得到了很大的提升。
固态硬盘SSD
原理:使用的Flash闪存芯片,和普通的U盘基本没有什么差别,使用EEPROM电擦除技术。
主机是如何做到访问固态硬盘的?
首先我们需要知道,主机访问硬盘一般都是操作系统指挥的,操作系统一般都是给出逻辑地址,然固态硬盘内的闪存翻译层(类似页表)的玩意会将逻辑地址转为物理地址,固态硬盘能够做到随机访问的一个原因也是因为闪存翻译层的存在,其可以直接进行地址映射,速度非常快。并且还需要注意的是固态硬盘的每次访问的基本单位是页!
固态硬盘在写入数据的时候,是如何进行擦除的?
固态硬盘擦除的基本单位是块为单位的,其每次会擦除一个块,一般是重复写入某个已有数据的块的时候会进行擦除。这里我们进行个解释:
我们知道,固态硬盘是以块为写入单位的,但是我们当前要写入的块可能原本就已经有数据了,但是固态硬盘无法对数据直接进行覆盖,必须先对数据进行擦除。也就说一个页,只有第一次写入不需要擦除,因为里面没有数据,从第二次写入开始就需要进行擦除了。但是这也导致了一个问题,因为固态硬盘擦除的基本单位是一个块,而一个块内具有多个页,擦除的时候就会导致其他页数据丢失,所以固态硬盘对此进行了处理,其类似写时拷贝,我们看下是如何处理的:
也就是说逻辑地址和物理地址的映射关系可能是会因为一些操作而改变的,例如重复写入。
事实上,除了写入的时候,固态硬盘具有自己的擦除策略,其还具有两种策略:
本质上是因为每个块都是有擦除寿命的,所以固态硬盘需要检测块的擦除寿命,使得大部分块的擦除寿命是平均的。
( 1 ) (1) (1)动态磨损均衡
固态硬盘在写入的时候,会优先选择写入擦除次数较少块,最后修正下逻辑地址和物理地址的映射。
( 2 ) (2) (2) 静态磨损均衡
固态硬盘会检测固态硬盘内数据的用处,这个有点抽象,我们举个例子:
固态硬盘内具有检测手段,会定义检测块的寿命和块内数据的用处,例如下图中两个块存储的是电影数据和游戏数据,固态硬盘在检测到以后,会发现存储游戏的块寿命比较短,而游戏数据经常需要写入,所以其会让两个块的内容进行一个交换,即让寿命较短的块存储尽可能是读的数据,寿命较长的块存储尽可能是写的数据。最后修正下逻辑地址和物理地址的映射即可。
关于机械硬盘和固态硬盘的地址
无论是机械硬盘还是固态硬盘,其操作者都是操作系统,操作系统在硬件层之上,所以操作系统不会直接参与物理地址,操作系统会管理逻辑地址,当要访问逻辑地址时,操作系统只需要让底下的硬件进行映射转物理地址即可。例如指挥闪存翻译层翻译逻辑地址。但是机械硬盘是否需要地址转换我就不是很懂了。并且我们需要知道物理地址一般是刻录在硬件上的,逻辑地址一般是硬件层之上的。由硬件完成逻辑到物理的转换。