去年底,生成式AI(AIGC)开始席卷全球,吸引社会各界的广泛关注。
正所谓AI黄金时代的到来,将重新定义各行各业。AIGC热浪来袭,标志着在数实融合的大趋势下,人工智能大范围应用的奇点已经来临,将对未来整个社会经济发展产生深远影响。
事实上,随着AIGC的兴起,除了像自动驾驶、智慧金融、智能客服等智慧应用大量涌现之外,越来越多行业用户今年将目光瞄准了AI大模型,寄希望通过AI大模型、AIGC强大的能力来改变自身,真正让业务走向智能化。
但强大的AIGC背后是基础设施、大模型和模型应用等一系列复杂工程化的结果,绝非简单搭建即可实现。尤其是在基础设施领域,AIGC带来的算法复杂度、数据量指数级增长,以及模型层数、参数规模快速膨胀,对算力、存储、网络等基础设施提出了前所未有的挑战。
正如新华三集团副总裁、计算存储产品线总裁徐润安在今年新华三领航者峰会上所言:计算、存储等基础设施正在加速走向变革,成为“数字中国”建设的重要基石以及各行业加速业务创新的源动力。新华三将以“内生智能 成就智慧”IT技术战略,为AI时代构建坚实的基础设施底座。
AI时代,基础设施迎来巨变
Gartner预测,到2025年,人工智能将成为推动基础架构决策的最主要因素之一,这将导致基础设施需求增长10倍。
除了基础设施需求增长之外,AIGC、AI大模型等人工智能相关技术的快速发展,正在对包括算力、存储、网络等在内的基础设施产生不可低估的影响。
首先,大量智慧应用的涌现带来了算力革命,过去通用算力一统天下的局面正在打破,多元异构算力成为大势所趋。根据《中国算力发展指数白皮书》的预测,预计2025年全球算力规模将达到3300 EFlops,2021-2025年年均复合增长率达到52.2%,其中AI算力占比将持续提升。
随着越来越多用户瞄准的AI大模型,带来了对于多元算力管理、异构内存高效利用等一系列挑战。比如,当前诸多大模型每进行一次训练迭代需要消耗4.5ExaFLOPS算力,而主流GPU卡单卡算力只能达到TFLOPS级别,这意味着在大集群下如何高效调度、管理和发挥算力潜能至关重要。
其次,AI大模型正在加速走向多模态大模型,标志着将进一步接入音视频数据,PB级海量数据的训练将会对存储的性能、容量等带来巨大的挑战。而随着AIGC应用的深入,随之而来的推理需求也会对数据处理性能提出更高要求。例如,OpenAI GPT-5开始就是多模态大模型,国内多款大模型也在走向多模态,一旦这些大模型接入到像车路协同、智能制造、智慧医疗等场景,对数据处理效率提出全新要求。
第三,AIGC对于基础设施自身的智能化和绿色化正在产生关键性影响。智慧应用需要大量算力、存储资源做支撑,但并不意味着仅仅是简单的基础设施堆砌,如何高效使用基础设施,将会成为越来越用户关注的焦点。比如,智慧应用的规模化和场景化,将极大提升数据处理的复杂度,需要采集、训练、推理等环节的数据互通性提升,减少不必要的协议转换,提升数据处理的智能化程度;又如,大量算力的消耗带来了显著的能耗问题,如何让基础设施更加绿色节能也是关键。
因此,AI时代的到来,极大的推动基础设施变革。最新《数字中国规划》的“2522”的整体框架也明确提出夯实数字基础设施和数据资源体系“两大基础”。像新华三也在本次领航者峰会上推出了“AIGC开放战略”,ICT基础设施架构是核心之一。
徐润安认为,AIGC正在数字化时代掀起新一轮的智能革命,智能技术与行业场景的深度融合,将推动算力、数据、管理和节能等产品重构和升级,而新华三也将引领基础设施的变革,帮助百行百业用户应对AI时代的到来。
未来就绪的可进化算力
进入到AI时代,算力的进化至关重要。
众所周知,智慧应用的大量涌现带来了对于算力需求的颠覆性变化,直接推动了数据中心算力基础设施的需求变化:随着AI应用的大幅增加,数据中心和单位设备的算力密度在持续提升;多核技术、GPU、NPU等普及,让异构算力设备的种类大幅增加;多元的算力需求推动算力基础设施走向细分化、专用化,算力走向调度管理的高效化和智能化……
新华三集团计算存储产品线副总裁刘宏程认为,大量智慧应用推动数实融合走向深化,也对底层算力形态和架构带来直接影响。过去通用计算时代,计算类型单一,以集中式架构为主,在应用场景存在着复杂、低效和僵化等显著问题,算力架构、产品等面临着重塑,采用分布式架构的可进化、高效、绿色的智慧计算将是算力基础设施未来方向。
事实上,算力基础设施架构的加速变化并非无迹可循。像CXL协议近年来获得产业界上下游的高度认可就是一个缩影。CXL协议真正开始打破传统的冯诺依曼计算体系架构,以内存为中心重塑整个计算体系,迎合了AI时代的算力发展需求。
刘宏程直言:“CXL协议发展到3.0阶段,未来2-3年会对整个计算架构产生直接且重要的影响。当前最重要的就是,包括新华三在内的产业链上下游做好标准、产品预研,为未来做好准备。”
针对算力基础设施的变革,新华三着重打造了“一体·两中枢”智慧计算体系。所谓“一体”是以CPU、GPU和xPU为核心,新华三构建起覆盖通用计算、异构计算等全场景的多元计算体系,并融入液冷等低碳技术,构建起高效、低碳数据中心的算力基石;而“两中枢”则是智能算力中枢和智能管理中枢,聚焦数据中心提供全生命周期的智能管理,以全流程的算力智能调度赋能AI开发核心能力,加速AI创新。
明显能够看出,算力需要体系化进行重塑和持续进化,在场景覆盖、管理调度和绿色节能等方面满足AI时代的全新需求。而新华三的“一体·两中枢”智慧计算体系,无疑率先从算力体系化的视角思考算力的演进发展,并在产品、解决方案等层面全面发力,为AI时代的算力需求做好充足的准备。
比如,全新的H3C UniServer G6和HPE Gen11系列产品覆盖通用、异构和负载优化三大场景需求,并且践行异构计算设计理念,兼容NVIDIA Hopper架构和OAI架构,同时支持各种DPU,AI算力提升高达10倍,通用算力性能提升53%,数据分析效率提升3倍,为不同的应用场景提供了澎湃算力。
又如,算力基础设施的功耗在未来会成为一大挑战。像当前最先进的GPU卡功率达到400W,加上服务器的耗电,换算到单机柜则功耗最少达到50KW,未来随着AIGC应用的深入,算力密度的提升一定会带来能耗的提升,需要更加绿色、高效的算力供给。为此,新华三在本次峰会上还宣布了“ALL in GREEN”理念,新华三液冷解决方案实现交换机、服务器、微模块等不同产品的改造,并将液冷技术全面融入到全新的UniServer G6系列服务器中,加上统一的管理和智能运维,让数据中心真正全面走向绿色节能。
再如,新华三傲飞算力平台已经实现了8000个节点规模的调度,针对AI和科学计算场景,可以让在算力规模越来越大情况下,精准匹配算力需求、智能部署和智能调度。“傲飞算力平台能够让AI训练时间等大幅降低,并且具有裸机、容器化和虚拟化三种部署方式,灵活满足用户的需求。”刘宏程补充道。
智慧存储,构筑AI时代的基石
众所周知,数据是AI应用的关键所在。
随着AIGC的兴起,AI大模型在加速走向多模态和复杂化,除了带来PB级甚至EB级的海量数据之外,也让混合工作负载迅速增多,大幅提升了实时性极强的数据处理需求。因此,一个好的存储平台就是AI时代的基石,为AI大模型源源不断输入数据要素,真正让AI大模型的通用性变强,加速走向百行百业。
当前,传统存储从数据类型、数据处理流程和效率来看,都已经很难胜任AI时代的数据处理任务。比如,传统存储很难在一个系统中满足不同数据类型或者工作负载对于性能的不同需求。比如,随着AIGC的能力将深入到各个垂直领域进行发展,会吸收更多行业相关的数据进行训练,AI训练的性能瓶颈可能很快就出现。
当前,存储正朝着数据非结构化、数据应用多样化、全闪存场景、AI赋能、绿色节能等五个方向,智慧存储被业界视为是存储发展的大势所趋。所谓智慧存储,核心主要有两个方面:其一、在性能、扩展性等方面很好地支撑起各类AI应用,满足AI时代复杂的数据存储和管理需求;其二、存储系统自身需要走向智能,无论是工作负载的调优、存储系统的运维还是数据管理、节能减排等均会走向智能化,大幅降低存储使用的复杂性。
“未来十年,以服务为导向的智慧存储将带来巨大的技术变革。新华三认为智慧存储的演进方向将集中在智能化运维、云化式体验、追溯碳足迹三个方面。”新华三集团存储产品线副总经理兼首席产品经理关天舒介绍道。
在智慧存储领域,新华三是当之无愧的引领者,其以AI存储智慧中枢为核心的发展路线在近年来的市场中被证明极具前瞻性且非常成功。AI存储智慧中枢平台可协助用户将焦点从底层的存储布局转变到上层的应用维度,帮助用户无缝调配数据,自动资源分配与任务分发,提前风险预测和主动故障处理,并实现按使用计费的公有云式体验。
在本次领航者峰会上,新华三将AI存储智慧中枢升级到3.0版本,进一步实现了系统资源的净空预测,了解工作负载的压力与变化,理解和掌握业务规律,并能进行正确分析和判断,进一步提升了智慧存储的智能化程度。
针对AI应用的全面支撑,分布式存储被认为将堪当大任。《分布式融合存储发展白皮书》预测,分布式融合存储在云、大数据分析、AI等应用场景有着广泛的部署需求。为此,新华三正式发布了新一代分布式存储X18000 G6,具备极致可靠极简运维、极致性能极低时延、一框交付极致敏捷、整体优化极致节能等多重优势,可以很好地支撑起自动驾驶、海量数据智能实时分析等场景。
“AI应用带来大量的非结构化数据,会进一步推动高性能文件存储和对象存储的需求。并且,随着RDMA、RoCE、NVMe、CXL等相关技术的不断发展,存储产品的形态未来还会持续创新与演进。新华三智慧存储会持续聚焦新智能和新协议的演进。”关天舒补充道。
综合观察,以AIGC为代表人工智能浪潮,正在开启AI新时代,百行百业的生产力有望实现又一次飞跃。与此同时,基础设施的变革大幕也在加速开启,CXL、GPU、NPU、AI等多种技术推动着服务器、存储等基础设施产品走向重塑。新华三作为ICT领域的佼佼者,在服务器、存储等基础设施领域耕耘多年,深刻洞察和理解AI时代的各种挑战与需求变化,通过布局智慧计算和智慧存储,为百行百业构建起AI时代的数字底座,按下数实融合的快进键,真正让百行百业用户在数字化浪潮中扬帆远行。