非对称RAID破解SSD异构存储难题

news2025/1/11 21:08:54

上一篇文章(Kioxia的NVMe RAID卸载有何亮点?)介绍了NVMe RAID卸载方案内容。本文我们结合一篇学术论文,学习一下新的非对称RAID架构~

图片


随着大数据时代的到来,全闪存阵列(All-Flash Arrays, AFAs)因其高性能、低功耗以及紧凑的外形而成为满足日益增长存储需求的理想选择。然而,SSD相较于传统的硬盘驱动器(Hard Disk Drives, HDDs)呈现出独特的挑战,包括性能和容量的显著差异,以及随时间推移的性能衰退。近期,有研究人员提出了一种新的RAID架构——Asymmetric-RAID(简称Asym-RAID),它能够优化系统性能并提高存储利用率,通过利用SSD池中固有的异质性来解决这一问题。

图片

传统RAID解决方案(例如Linux MD)通过均匀分配写操作来实现高I/O并行性和数据可靠性。这一设计假设底层存储组件在性能和容量上是同质的。然而,即使是同一型号的SSD,也会表现出非常不同的特性和随时间退化的性能,这会导致严重的硬盘利用率不足。

  • NVMNVMe SSD在顺序读取性能上明显优于SATA SSD,这主要是因为NVMe SSD采用了更高效的PCIe接口,能够提供更高的带宽和更低的延迟。

  • 传统RAID解决方案的性能受到性能最低的磁盘的限制。在本例中,SATA+NVMe RAID-5系统的性能受到单个SATA SSD性能的限制,导致整体性能无法充分利用NVMe SSD的优势。这说明传统RAID架构在面对SSD异质性时存在明显的性能瓶颈。

图片

另外,现代固态硬盘(SSD)由于TLC/QLC闪存的不同制造设计,展现出非常不同的性能特征。这些性能差异对RAID系统的构建和性能产生了重大影响。即便是在同一型号的SSD之间,性能异构性也是一个持续存在的挑战。首先,SSD从生产之初就存在性能差异,这是由于NAND闪存单元的质量差异和固件版本的不同。其次,取决于工作负载,即使来自同一品牌的SSD,在RAID配置中也会经历不同程度的性能退化。

我们通过实验展示SSD性能随时间的变化情况。实验中使用的是一块企业级SSD,在大约90天内每天向其写入大约100TB的数据。在每天服务器空闲的时间段内,对SSD执行只读I/O工作负载(即4KiB顺序读取)的测试,以避免SSD垃圾回收(GC)和其他主机中断的影响。如下图所示,即使没有SSD垃圾回收和主机中断的影响,SSD也无法在长时间内保持一致的性能。经过90天相同的负载后,平均延迟相比初始状态增加了96%。

图片

全闪存阵列(All-Flash Arrays, AFAs)系统已被广泛研究,相关方法大致可以分为三类:缓解尾部延迟(Tail-Latency)、提高性能和改进可靠性。这些方法大多基于磁盘组件具有相同容量和相似性能的假设,而少数专注于系统的可靠性视角。

图片

现有的AFAs系统方法虽然在一定程度上解决了全闪存阵列面临的一些关键问题,但大多数方法假设磁盘组件具有相同的容量和相似的性能,这在现实中并不总是成立。此外,这些方法通常只关注性能或可靠性的某个方面,而未能充分考虑SSD异构性对整个系统性能的影响。

针对这些问题,Asymmetric-RAID (Asym-RAID) 提供了一种新的解决方案,它通过不对称地分配数据来充分利用每个SSD的容量,并通过差异化地导出每个数据条带的地址空间来改善性能,允许进行性能优化的数据放置。

Asymmetric-RAID的设计目的是解决现代SSD的异构性问题。它通过对数据不对称地分布来充分利用每个SSD的容量,同时数学上保证向主机导出的最大逻辑卷容量。为了避免性能瓶颈,Asym-RAID根据性能特性维护多个条带组,并差异化地将每个数据条带的地址空间导出到主机,允许进行性能优化的数据放置。

图片

Asymmetric-RAID设计的核心理念是异构性感知。该设计通过不对称地分布数据,充分利用每个SSD的容量和性能。具体来说,更多数据将放置在容量较大的SSD上,而容量较小的SSD则存储较少的数据。如上图展示了Asym-RAID的整体架构,以一个简单的(2+1) RAID-5配置为例(即2个数据块和1个奇偶校验块),来自一个5磁盘的阵列。Asym-RAID引入了一个二维逻辑地址空间,位于用户感知逻辑地址空间和SSD逻辑地址空间之间的一个内部逻辑块层,其中每一行对应一个单独的设备。Asym-RAID随后将每个地址空间划分为一个或多个条带组,并根据设备性能差异化地导出到主机的一维逻辑地址空间。

对于传统的N磁盘RAID阵列,每个数据条带由恰好N个块组成,这些块均匀分布在N个磁盘上。为了将数据分布在超过典型RAID阵列大小的磁盘池中,一种直接的方法是物理上将磁盘池分成两个RAID组,每个组可能配置有不同的RAID设置,其中每个磁盘属于一个RAID阵列。例如,RAID-50遵循这种方法。虽然这种方法实现了良好的磁盘隔离和高效的条带到磁盘映射,但每个设备仅使用固定数量的容量。

相比之下,Asym-RAID不对称地分布数据,目标是充分利用每个SSD的容量,并最大化向主机导出的有效逻辑容量。因此,容量较大的SSD将被分配更多的数据和奇偶校验块。

  • Asymmetric-RAID通过引入二维逻辑地址空间来不对称地分布数据,以充分利用每个SSD的容量和性能。这种方法允许更大容量的SSD存储更多数据,而较小容量的SSD则存储较少的数据,从而提高整体存储利用率。

  • Asymmetric-RAID通过不对称地分布数据条带来解决磁盘池中SSD的异构性问题。它将数据条带宽度k(k < N)的数据条带中的块不对称地分配给磁盘,以最大化每个SSD的利用率。通过这种方法,Asymmetric-RAID能够根据每个SSD的容量和性能特性,实现数据的最优放置。

  • Asymmetric-RAID的数据分布方案可以被看作是一个优化问题,其中目标是最大化完整的数据条带数量,同时考虑到每个SSD的容量限制。

图片

Asym-RAID采用了一种确定性的映射方式来将上层逻辑块地址(LBA)转换为SSD逻辑地址,通过查询条带状态表(SST),这种方式提高了容量利用率并减少了寻址所需的元数据开销,相比于动态映射机制更具优势。

  • 条带状态表(SST):Asymmetric-RAID设计了一个条带状态表(SST)来维护每个条带组的映射信息,它将用户LBA转换为设备LBA。SST中的每项条目包含四个字段:start_LBA(条带组的起始LBA)、length(条带组长度)、disk_components(参与磁盘的相对顺序)以及disk_offsets(条带组在磁盘上的起始LBA)。

  • 性能优化的放置:Asymmetric-RAID通过分析每个条带组的性能特征,将条带组的地址空间串联并导出到主机。结果是,用户感知的LBA0将被映射到性能最高的磁盘上,而后续的LBA将被分配到性能逐渐降低的磁盘上。例如,性能最高的条带组0由SSD 1、2和4组成,而性能较低的磁盘组件则被映射到后续的蓝色和灰色块。

Asymmetric-RAID代表了一个重要的发展方向,即针对现代SSD异质性的存储系统设计。通过更深入地理解SSD的工作原理及其随时间的变化特性,我们可以构建更加高效且可靠的存储解决方案。未来的研究将致力于进一步优化和扩展Asymmetric-RAID的功能,以应对大数据时代面临的挑战。

参考文献:Ziyang Jiao and Bryan S. Kim. 2024. Asymmetric RAID: Rethinking RAID for SSD Heterogeneity. In Proceedings of the 16th ACM Workshop on Hot Topics in Storage and File Systems (HotStorage '24). Association for Computing Machinery, New York, NY, USA, 101–107. https://doi.org/10.1145/3655038.3665952


如果您看完有所受益,欢迎点击文章底部左下角“关注”并点击“分享”、“在看”,非常感谢!

精彩推荐:

  • ZNS SSD是不是持久缓存的理想选择?

  • 太上老君的“三味真火”也可以提升3D NAND可靠性!

  • FMS 2024:多家厂商CXL技术方案总览

  • 存储正式迈入超大容量SSD时代!

  • FMS 2024: 带来哪些存储技术亮点?

  • IEEE报告解读:存储技术发展趋势分析

  • 什么?陶瓷也可以用来存储数据了?

  • 都说固态硬盘寿命短,那么谁把使用寿命用完了吗?

  • 内存原生CRAM技术将会颠覆计算存储的未来?

  • 浅析SSD性能与NAND速率的关联

  • MCR DIMM如何解决内存带宽瓶颈?

  • 浅析MPS对PCIe系统稳定性的影响

  • CXL-GPU: 全球首款实现百ns以内的低延迟CXL解决方案

  • 万字长文|下一代系统内存数据加速接口SDXI解读

  • 数据中心:AI范式下的内存挑战与机遇

  • WDC西部数据闪存业务救赎之路,会成功吗?

  • 属于PCIe 7.0的那道光来了~

  • 深度剖析:AI存储架构的挑战与解决方案

  • CXL崛起:2024启航,2025年开启新时代

  • NVMe SSD:ZNS与FDP对决,你选谁?

  • 浅析PCI配置空间

  • 浅析PCIe系统性能

  • 存储随笔《NVMe专题》大合集及PDF版正式发布!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2094146.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

校园一卡通|基于SprinBoot+vue的校园一卡通系统(源码+数据库+文档)

校园一卡通系统 基于SprinBootvue的校园一卡通系统 一、前言 二、系统设计 三、系统功能设计 系统功能实现 后台模块实现 管理员功能实现 学生功能实现 四、数据库设计 五、核心代码 六、论文参考 七、最新计算机毕设选题推荐 八、源码获取&#xff1a; 博主介绍…

linux驱动 -- PWM配置和SysFs操作方法

1&#xff1a;PWM介绍 PWM的定义为:可调节脉冲调节器&#xff0c;换句话来说就是一个总周期不变&#xff0c;占空比可调节的方波。 2&#xff1a;PWM的总周期和占空比、有效点平 方波&#xff1a;在信号领域一般分为数字信号和模拟信号&#xff0c;数字信号就两种状态&#…

UML类图中的依赖,继承,和实现关系

依赖关系 依赖关系是一种使用关系&#xff0c;它是对象之间耦合度最弱的一种关系。在代码中&#xff0c;某个类通过局部变量&#xff0c;方法的参数或者对静态方法的调用来访问另外一个类的方法。 依赖关系通过带箭头的虚线表示&#xff0c;箭头从使用类指向被依赖的类 继承关…

中仕公考怎么样?函授大专可以考公吗?

函授大专学历&#xff0c;作为成人高等教育的一种形式&#xff0c;是被认证的&#xff0c;所以在绝大多数情况下&#xff0c;持有函授大专学历的个人符合公务员及事业单位岗位的报考资格。只有招聘公告中明确要求考生必须持有全日制或统招学历时&#xff0c;才不符合条件。 在…

【STM32开发指南】STM32最小系统板详解

【前言】 在单片机项目开发中&#xff0c;STM32系列微控制器因其高性能、低功耗和丰富的外设资源而备受青睐。其中&#xff0c;STM32最小系统板作为STMicroelectronics STM32系列微控制器的基础硬件平台&#xff0c;不仅简化了硬件设计&#xff0c;还极大地促进了软件开发的便…

用ChatGPT提升论文质量:改进语法、用词和行文的有效方法

学境思源&#xff0c;一键生成论文初稿&#xff1a; AcademicIdeas - 学境思源AI论文写作 在学术写作中&#xff0c;语法、用词和行文的质量直接影响论文的可读性和学术价值。今天我们将介绍如何利用ChatGPT优化论文的语法结构、改进用词精准度以及提升行文流畅性。帮助写作者…

多线程篇(锁相关类- StampedLock(改进的读写锁)(JDK8新增))(持续更新迭代)

目录 一、前言 二、StampedLock提供的三种读写模式的锁分别如下 写锁writeLock 悲观读锁 readLock 乐观读锁 tryOptimisticRead 三、StampedLock支持这三种锁在一定条件下进行相互转换 四、案例介绍 五、知识小结 一、前言 StampedLock 是并发包里面 JDK8 版本新增的一…

线性代数 第二讲 矩阵_逆矩阵_伴随矩阵_分块矩阵_初等矩阵_矩阵的秩

矩阵 文章目录 矩阵1.矩阵的定义2.矩阵的运算法则3.特殊矩阵3.1 伴随矩阵3.2 可逆矩阵3.2.1 定义3.2.2 可逆矩阵的一些定理3.2.3 可逆矩阵公式与转置矩阵公式3.2.4 求逆矩阵 3.3 分块矩阵3.3.1 分块矩阵的运算3.3.2 分块矩阵的初等行变换&#xff08;超纲内容但要了解&#xff…

YOLOv9输出模型每一层的耗时和GFLOPs

在做一些比较实验中&#xff0c;如何更精确的查看和对比我们的改进模块时候有效&#xff0c;是否有提升&#xff0c;特别是在模型轻量化时&#xff0c;这时候我们就可以打印改进模型每一层的耗时和GFLOPS来比较不同模块的占用量。在YOLOv9中&#xff0c;打印模型每一层的耗时和…

食堂线上预约点餐系统小程序的设计

管理员账户功能包括&#xff1a;系统首页&#xff0c;个人中心&#xff0c;学生管理&#xff0c;菜品分类管理&#xff0c;菜品管理&#xff0c;关于我们管理&#xff0c;意见反馈&#xff0c;系统管理 微信端账号功能包括&#xff1a;系统首页&#xff0c;菜品&#xff0c;购…

TPH-YOLOv5:基于Transformer预测头的改进YOLOv5,用于无人机捕获场景的目标检测

摘要 提出了TPH-YOLOv5。在YOLOv5的基础上&#xff0c;增加了一个预测头来检测不同尺度的目标。然后用Transformer Prediction Heads&#xff08;TPH&#xff09;代替原有的预测头&#xff0c;探索自注意机制的预测潜力。还集成了卷积块注意力模型&#xff08;CBAM&#xff09;…

2D 智慧水务厂:引领水资源数字化管理

图扑 2D 智慧水务厂通过数字监控和数据分析&#xff0c;实现高效水资源管理与优化&#xff0c;显著提升运营效率。

【开发心得】筑梦上海:项目风云录(2)

特别声明 这个长篇终于开了头&#xff0c;工作的节奏也不能耽搁&#xff0c;暂时也不知道何时才能收尾。人生漫漫&#xff0c;即使没有雷军们的成功&#xff0c;但是也有自己的一些小确幸。 特别声明一下&#xff0c;虽然这个长篇是基于真实经历&#xff0c;但其中有些内容纯…

Python优化算法22——自适应变异麻雀搜索优化算法(AMSSA)

科研里面优化算法都用的多&#xff0c;尤其是各种动物园里面的智能仿生优化算法&#xff0c;但是目前都是MATLAB的代码多&#xff0c;python几乎没有什么包&#xff0c;这次把优化算法系列的代码都从底层手写开始。 需要看以前的优化算法文章可以参考&#xff1a;Python优化算…

四、Selenium操作指南(一)

文章目录 一、基本用法&#xff08;一&#xff09;初始化浏览器对象&#xff08;二&#xff09;访问页面&#xff08;三&#xff09;设置浏览器大小&#xff08;四&#xff09;刷新页面&#xff08;五&#xff09;前进后退 二、获取页面基础属性三、定位页面元素&#xff08;一…

30Kg载重1小时长续航油电混动无人机技术详解

关于30Kg载重、1小时长续航的油电混动无人机技术&#xff0c;我们可以从以下几个方面进行详细解析&#xff1a; 一、动力系统 1. 油电混合技术 油电混合优势&#xff1a;油电混合无人机结合了燃油发动机的高能量密度和电动机的稳定性和精确控制性&#xff0c;能够在长时间飞…

力扣452-用最少数量的箭引爆气球(Java详细题解)

题目链接&#xff1a;452. 用最少数量的箭引爆气球 - 力扣&#xff08;LeetCode&#xff09; 前情提要&#xff1a; 因为本人最近都来刷贪心类的题目所以该题就默认用贪心方法来做。 贪心方法&#xff1a;局部最优推出全局最优。 如果一个题你觉得可以用局部最优推出全局最…

PCL-直通滤波

本篇内容&#xff1a; 讲解直通滤波的作用通过pcl实现直通滤波 效果&#xff1a; 1 主要原理 点云数据通常包含x、y、z三个维度的数据&#xff0c;用户指定维度、范围后&#xff0c;直通滤波过滤或保留该范围内的所有点云 假设我指定维度’y’&#xff0c;范围&#xff08;…

华为OD机试真题 - 字符串加解密(Java/Python/JS/C/C++ 2024 D卷 100分)

华为OD机试 2024E卷题库疯狂收录中,刷题点这里 专栏导读 本专栏收录于《华为OD机试真题(Java/Python/JS/C/C++)》。 刷的越多,抽中的概率越大,私信哪吒,备注华为OD,加入华为OD刷题交流群,每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX…

如何让“相信相信的力量”帮你多赚100万

公门洞开纳百川 众心逐梦越千山 号召引领潜力绽 心觉潜意识无间 我们经常听到这句话&#xff1a;相信相信的力量 为什么要相信相信的力量 相信是什么意思 相信的力量又是什么意思 我估计99%的人不知道这句话的底层逻辑是什么 如果你悟透了&#xff0c;你的并且践行了&…