JCST 2023 Paper 分布式元数据论文阅读笔记整理
问题
非易失性存储器(NVM)提供比块设备更低的延迟和更高的带宽,支持字节可寻址,并提供可用作内存级存储设备(非易失性主存储器,NVMM)的持久性。因此,可以直接在NVMM上构建一个文件系统。但传统的文件系统是基于慢速块设备设计的,使用深度和复杂的软件栈来优化文件系统性能,并不适用于NVMM文件系统。在NVMM文件系统中,应重新考虑性能、可扩展性、延迟、崩溃一致性、写放大、数据保护、磨损均衡和跨硬件存储。
目前NVMM的读写延迟和带宽如表1所示。
本文工作
本文调查了优化NVMM文件系统的现有工作。
-
分析了在NVMM上直接使用传统文件系统时存在的问题,包括软件开销大、可扩展性有限、一致性保证技术不当等。
-
总结了30种典型的NVMM文件系统的技术,并分析了它们的优缺点。
-
为基于真实硬件Optane DC持久存储模块设计高性能NVMM文件系统提供了一些建议:应用各种技术来减少软件开销;提高虚拟文件系统(VFS)的可扩展性;采用高度并发的数据结构(如锁和索引);使用内存保护密钥(MPK)进行数据保护;仔细设计跨媒体文件系统的数据放置/迁移。
减少软件开销
基本架构
优化方法
提升并发性
优化方法
崩溃一致性
COW和日志
日志结构
软更新
快照
优化方法
数据保护和磨损均衡
在用户级别使用MPK,在监督模式下使用写入机制。对于NVMM中的硬件错误,可以使用校验和和ECC。
Inode经常被访问,很容易导致磨损,设计文件系统时应考虑这一点。
跨硬件存储系统
使用NVMM作为cache,或使用NVMM存储经常访问的数据。
优化方法
总结
对现有NVMM上的文件系统进行总结,现有方法主要从4个方面进行优化:降低软件开销(缩短IO栈、NVMM感知缓存、使用用户级文件系统、构建NVMM友好索引)、优化扩展性(细粒度锁、高并发索引结构)、优化崩溃一致性(日志、写时复制)、优化跨硬件存储系统(NVMM作为caceh、数据放置和迁移)。