作为数字经济的核心产业,云与互联网数据中心正面临着下一波技术浪潮的冲击:云原生应用和Serverless无服务器计算的全面普及,推动数据中心底层硬件资源彻底解耦池化和重组整合,形成新的扁平分层——新型存算分离硬件架构,这就是Diskless架构。
当前的云与互联网数据中心多采用计算存储一体化的服务器作为基础单元,不同服务器上的计算和存储硬件资源难以共享,利用率低下。而Diskless架构则让存储资源从服务器中独立出来形成新的共享硬件形态,整个数据中心形成了独立的算力模组、存储模组和网络模组等共享资源池,进一步提升整个数据中心的效率以及降低成本和能耗。
2022年12月22日,中国计算机协会(CCF)信息存储技术专委会、天翼云、中国电子云、华为、中科驭数等10余家企业机构联合主办《数据中心Diskless架构》白皮书发布会,首次全面探讨了Diskless架构。“《数据中心Diskless架构》白皮书系统地梳理了数据中心架构转型的背景和挑战,提出了一种新的数据中心架构模式——数据中心Diskless架构”,中国工程院院士郑纬民表示,“这份研究对于相关决策部门、企业界、学术界具有很好的启示和参考意义。”
数据中心的再变革
2022年是云原生技术迅猛推进的一年,特别是以Serverless无服务器计算为代表的云原生应用,彻底摆脱了对于底层硬件资源环境的依赖。2022年,各大云服务厂商纷纷宣布旗下核心云产品与服务的全面Serverless化。从容器化到Serverless化,云原生开始从软件层面全面变革数据中心。
云原生是自上而下,从软件层面改进数据中心的效率,然而这只解决了问题的一半。Diskless是对云与互联网数据中心资源的第二次效率革命,通过全面改变数据中心硬件组合形态,自下而上改进数据中心效率。实际上,随着海量数据的爆发和动态业务的增强,对于基础设施的灵活性和利用率提出全新的要求。
(传统存算一体服务器架构面临容量利用率三大挑战。图片来源:CCF)
CCF信息存储技术专委会主任、清华大学教授、厦门大学信息学院院长舒继武教授指出,当前的数据中心采用的是存算一体的服务器,导致计算与存储更新周期不匹配,系统扩展时资源得不到充分利用,还增加了数据迁移等工作;而支撑业务的服务器存储无论是性能型还是容量型,都无法同时实现高性能、高可靠性与高资源利用率等。此外,Serverless等新型分布式应用要求共享存储,各种IO处理占用算力而导致的“数据中心税”等等,都要求新的数据中心架构。
所谓Diskless架构,与传统存算分离架构相比,将原来服务器中的本地盘拉远,构成无盘化的服务器和远端存储池。Diskless架构彻底打破各类存算硬件资源的边界,将原有架构的多级分层资源进行彻底解耦池化和重组整合,形成新的扁平分层,简化了数据基础设施架构。同时,Diskless架构将通用CPU不擅长的任务卸载到各种专用处理器上,使硬件的组装更为灵活,从全局角度实现了硬件资源最优组合,彻底释放数据中心的效率,解决了现有数据中心的诸多问题。
数据中心Diskless架构化
根据《数据中心Diskless架构》白皮书,数据中心Diskless架构由无盘化的服务器、极高存力密度的存储系统、专用数据处理器和多样化的网络协议组成。Diskless架构分为三大分层:存储模组、算力模组和网络模组,提供高容量极简盘框、本地存储拉远池化、无盘化服务器、新型网络灵活组装等几大新兴能力。
(数据中心Diskless架构的定义。图片来源:CCF)
首先也是最重要的新型组件,就是存储型模组,换言之就是将本地盘或本地内存从服务器独立出来,拉到远程形成共享存储池或共享内存池。存储型模组主要以EBOF、EBOM(Ethernet Bunch of Memory)、EBOD(Ethernet Bunch of Disk)等新型盘框形态存在。而RAID、大比例纠删码算法等传统存储能力,也从服务器中独立出来,放置到存储型模组中,形成了“盘即存储”的大盘技术。存储型模组对外通过NoF等高速共享网络,提供块、文件等标准存储服务。
其次,网络模组对于Diskless架构来说十分重要,网络模组需要解决远程访问硬盘和内存的带宽和时延问题,满足Diskless架构下多种场景池化接入的诉求。例如,服务器本地盘可通过NoF高速网络,独立到远程的EBOF盘框中实现SSD池化,而内存资源池也可通过CXL等新型总线型网络构建PB级共享大内存,形成远程共享内存空间。
当然,将存储从服务器独立出去后,服务器的形态也将发生重大改变。目前,以DPU为代表的专用处理器,卸载了部分CPU功能,释放CPU算力,就是服务器形态的一种改变。引入DPU等专用处理器后的Diskless架构,必然促成CPU算力的池化,打破传统以CPU为中心的服务器架构。随着数据中心出现大规模的存储模组,服务器的形态还将进一步变化,至于将出现什么样的服务器新物种,这就有赖于业界厂商的创新力了。
简单理解,Diskless架构改变了数据中心各类硬件的组合形式,让数据中心的各个硬件组件彻底独立,可灵活组合,也就是在硬件层面实现了可组合式架构(Composable Infrastructure)。可组合式架构本来是软件的理念,但Diskless架构进一步将其推进到了硬件层面。相应的,数据中心各种硬件的远近关系、松紧耦合的变化,催生了场景化数据缩减、数控分离、盘芯协同、高通量网络、网存协同等一系列新技术,从而实现各硬件组件之间更好的协作。
推动数字经济的进一步扩展
《“十四五”数字经济发展规划》指出:到2025年,数字经济全面迈向扩展期。而作为一种新兴的可组合硬件架构,Diskless架构数据中心将推动数字经济的全面扩展。
云原生、大数据、数据库、虚拟化、高性能计算……这些都是数字经济核心场景,Diskless架构能够更好地实现这些场景下的数据中心效率最大化,从而以更大规模推动这些场景的扩展。《数据中心Diskless架构》指出:Diskless架构为云和互联网等应用带来高资源利用率、高可靠、高性能等价值。
(云和互联网的三类典型Diskless应用场景。图片来源:《数据中心Diskless架构白皮书》)
互联网业务平台通常承载视频、图片、数据库、AI分析、大数据等业务场景,在传统云架构中,IaaS层存储基于服务器本地盘,搭载Ceph分布式文件系统。Diskless架构在云和互联网的应用主要有三种典型场景:一是针对虚拟化业务,直接将服务器本地盘拉远,用Diskless存储模组替代服务器本地盘。二是为数据库、大数据等业务提供大内存,加速数据处理;三是针对容器等新业务场景,为Ceph等分布式应用提供文件语义,并将温热数据分级到更冷的EBOD等机械硬盘存储模组中,提升存储效率。
目前,Diskless架构还是一种新兴的数据中心架构,需要业界的共同支持。西部数据的OpenFlex Data24 EBOF盘框、华为微存储、英伟达的BlueField系列DPU和中科驭数的KPU等都是对Diskless的有力尝试。天翼云、中国电子云、中科驭数、华为、大普微等企业已积极投入到Diskless架构的实践中。
整体来看:在华为等业界厂商的努力推动下,数据中心Diskless架构有望成为下一代大型数据中心的建设标准,可以满足云、互联网、电信、金融等行业接下来全面进入数字经济扩展期的需求,同时迎接疫情后的全面云原生化,以更高效率、更低成本、更强敏捷力,打下硬实力!展望2023,可以预见,Diskless数据中心将是数字经济规模化扩展的新基建。(文/宁川)