SSD的存储介质是什么,它就是NAND闪存。那你知道NAND闪存是怎么工作的吗?其实,它就是由很多个晶体管组成的。这些晶体管里面存储着电荷,代表着我们的二进制数据,要么是“0”,要么是“1”。NAND闪存原理上是一个CMOS管,有两个栅极,一个是控制栅极(Control Gate), 一个是浮栅(Floating Gate). 浮栅的作用就是存储电荷,而浮栅与沟道之间的氧化层(Oxide Layer)的好坏决定着浮栅存储电荷的可靠性,也就是NAND闪存的寿命。
目前市面上主要流通的就是4种NAND类型:SLC、MLC、TLC、QLC。随着每个寿命从高到低依次是SLC>MLC>TLC>QLC.
SSD的闪存芯片并非完美无缺。它们有一个共同的“短板”——寿命受限于闪存单元的磨损。在SSD中,每个闪存单元都有一定的寿命,通常为几万次到几百万次的写入。当一个单元被写满时,它就会被标记为“坏块”,不再用于存储数据。这种磨损效应会导致SSD的性能下降,甚至完全失效。
在现实应用过程中,SSD主控在NAND闪存写入数据时,并非均匀等机会的写入NAND闪存的每一个区块(Block)。借用宋小宝的经典桥段,SSD主控很难做到“雨露均沾”,而是很大程度可能会“独宠”一些NAND闪存区块。但是这样的“独宠”会严重透支NAND闪存区块寿命(NAND闪存区块的磨损-Write/Earse count会大大的增加,性能变差)。
为了解决这个问题,Wear Leveling技术应运而生。Wear Leveling是一种用于平衡SSD闪存单元磨损的技术,它的作用是尽可能将数据均匀地分布在各个闪存单元中,从而延长SSD的使用寿命。用更通俗的话来讲就是,每次写入的时候挑年轻力壮的区块, 年老的区块则颐养天年。
SSD由多个独立的NAND Flash芯片组成,每个NAND Flash由一个块阵列组成,每个块由一系列的存储单元(页)组成。在将数据写入NAND Flash的存储单元之前,必须对该存储单元进行擦除,以便可以进行写入。最小的擦除单元是块,最小的写入或者读取单元是页。
Wear Leveling的工作流程:Wear Leveling技术在SSD中通过设置两个块池,一个是空闲池,一个是数据池,来实现磨损平衡。当需要改写某个页时,并不直接写入原有位置,而是从空闲池中取出新的块,将现有的数据和需要改写的数据合并为新的块,一起写入新的空白块,原有的块被标识为无效状态(等待被擦除回收),新的块则进入数据池。后台任务会定时从数据池中取出无效数据的块,擦除后回收到空闲池中。
根据实现方式的不同,Wear Leveling通常可以分为动态损耗均衡(Dynamic Wear Leveling)和静态损耗均衡(Static Wear Leveling)。
动态损耗均衡是一种只在数据被改写时触发的均衡技术。当一个数据块被更新时,动态损耗均衡算法会计算出各个闪存单元的损耗情况,并选择损耗最严重的单元进行数据迁移。这种方式的优点是处理速度快,对性能影响小;缺点是对静态数据的处理效果不佳。
静态损耗均衡则是一种可以处理静态数据的均衡技术。它可以在后台运行,当发现损耗较低的闪存单元时,将其数据迁移到其他单元上,并将这些单元放入空闲池中备用。这种方式的优点是可以更好地保护静态数据;缺点是处理速度较慢,可能会对性能产生一定影响。
在Windows环境,如果需要监控查看SSD坏块的健康状态,比较简单,只可以用DiskGenius工具可以做个全盘扫描。
Linux环境下,建议SATA SSD用smartctl工具、NVME SSD用nvme-cli进行long DST全盘自检测。
最后,提前剧透一下:写这篇文章,其实是为了给后面一篇WL相关的文章做铺垫,预计本周内发布,敬请期待!