近日,百度智能云ABC Stack亮相由紫光集团和新华三集团主办的“2023 NAVIGATE 领航者峰会”互联网线上专题论坛。百度智能云私有云部副总经理史磊进行了主题为“百度智能云携手新华三共创互联网新时代”的演讲,分享了百度专有云ABC Stack智算版的技术优势及客户场景化解决方案,和新华三一道向行业客户推介百度专有云智算版行业应用最佳实践。
融合大模型平台的ABC Stack智算版
百度是全球为数不多在新IT四层架构(芯片、框架、模型、应用)中的每一层都有领先产品的公司。在这个基础上,百度智能云成为国内率先训练出生成式大语言模型的云。
专有云ABC Stack智算版,深度融合了百度智能云打造的一站式企业级大模型平台——文心千帆大模型平台,可以为企业提供大模型开发和应用的全流程的工具和平台。
ABC Stack智算版作为基础底座,上层进行芯片层、框架层、模型层、应用层纳管,赋予了大模型全流程的集中管控、运营运维统一化能力,更好地把大模型作为行业应用工具推出。在GPU虚拟化、高性能网络、分布式存储技术的综合优化下,百度专有云智算版在千卡加速比、资源利用率、开发效率方面有显著提升。
为更好地服务于企业应用,ABC Stack智算版使用VPC/RDMA双平面网络设计,支持IB/RoCE网络供企业根据实际情况灵活选择。使用spine-leaf 1:1的高性能网络,网络使用单独的网络接入及核心交换机,和VPC网络底层互通,达到网络不影响、存算效率提升的目的。基于独立的网络设备,目前ABC Stack智算版最大可支撑16000卡的IB网络,为国内GPU智算集群IB盒式组网最大规模。采用扁平化组网架构,GPU卡数据转发最多3跳,减少数据交互延迟。同时,ABC Stack智算版携手新华三RDMA高性能以太网络方案规模化部署,为客户打造智算中心提供了极大的灵活性。
打造一云多芯,符合监管的国产化云
专有云ABC Stack智算版,支持海光、鲲鹏、飞腾等国产化CPU,和昆仑、寒武纪、昇腾等国产化GPU,打造符合行业监管的国产化云。多CPU与多GPU资源池的架构设计,使得ABC Stack智算版在扩展性、效率化两方面有极致表现,在金融银行机构、互金领域已有落地实践。
支持异构资源池,客户在底层资源选择上有更多的空间,可以基于业务需求及应用历史适配经验进行选择。使用ABC Stack智算版进行统一纳管,上层管控平台可以实现对多厂家产品无差异化应用部署。
创新型智算网络运维平台
百度智能云和新华三一道进行智算网络的运维创新。通过智算网络秒级监控运维平台,使用Netconf、Telemetry等技术实现对智算网络的流量监控、端口TOPN、反压报文PFC指标、拥塞通告报文等的监控。通过对RDMA网络中的spine、leaf交换机监控,可实时监控网络质量,第一时间发现网络拥塞点,理清网络瓶颈点,快速进行网络故障定位及资源扩容。
在内网网络运维的基础上,百度智能云联合新华三防火墙,打造超高性能公网安全防御,在云租户侧为客户提供安全保障。创新型网络运维平台和高安全性网络安全配置,使得ABC Stack智算版能够更好地保障云上租户安全,打造安全可靠的高性能网络。
多行业ABC Stack智算版云平台实践落地
目前,ABC Stack智算版已在多行业部署落地。
在汽车制造领域,长安汽车使用百度专有云智算版进行数据采集平台、数据标注平台、数据训练平台、模型评价平台的多平台承载,助力自动驾驶集群的顺利落地。目前,此自动驾驶集群已在客户业务中进行使用,帮助客户数智化转型升级。
在金融领域,基于ABC Stack打造的某清算机构高并发、高性能国产化云在2021年上线,截止今日,已承载该清算机构每日数亿笔清算业务,充分展示了ABC Stack高性能、高可靠性的产品属性。
大模型时代,与大模型形成统一管控的云平台成为后续云发展的新方向。百度智能云ABC Stack智算版有先发优势。和新华三在网络、安全层面的深度合作,有利于百度智能云ABC Stack智算版更好地赋能智能未来。未来,百度智能云ABC Stack将会继续发挥自身“云智一体”的技术和资源优势,携手新华三为千行百业贡献力量,助力企业智能化升级转型。