大家好,我是技福的小咖老师。
随着云计算、大数据、人工智能等新一代信息技术的快速发展,数字技术已经渗透到我们日常生活的方方面面,同时也改变了所有行业。数据中心,将算力源源不断地输送给数字世界,逐渐成为云计算、工业互联网、人工智能的万能粮仓。
咱们今天就来聊聊这个“万能粮仓”,云超融合数据中心网络 CloudFabric。
数据中心网络服务于云应用、计算资源与存储资源。三大服务对象的变革正在驱动数据中心网络向以太化演进:
• 云化升级:云化加速浪潮之下,企业 IT 架构从本地集中式向云端分布式、甚至多云分布式演进。开放以太架构天然可被云灵活调用,具备良好的互通性、弹性、敏捷性以及多租户安全能力,已经成为通用计算网络的压倒性协议。
• 存储全闪存化:随着机械硬盘向全闪存升级,存储介质的读写性能提升了百倍。业界主流FC网络使用16G/32G带宽,不满足全闪存高吞吐的需求,带宽高达 400GE 的以太网成为新一代存储网络的事实标准。
• 计算单元去 PCIe:业界 CPU/GPU 厂商正在通过去 PCIe 总线突破总线的速率瓶颈,直接出以太口来提供更高算力。
一、数据中心网络向全以太化演进
在云计算时代,通过数据中心所承载的手机APP、智能分析、企业办公等新型应用正在改变企业的开发、生产及运营模式。
在跨DC双活存储网络方案中,以太网长距丢包率大于0.2%,不满足存储绝对0丢包的需求。同城70公里的双向时延高达1ms,DC 内和跨 DC 时延相差100倍,短距随着例如银行进入Bank4.0时代,两地三中心向多云多数据中心发展,线上金融交易增长迅速,金融业务逐渐上云。金融云未来9年复合增长率预计18.34%,数据中心建云联云成为刚需。
调优算法的流量调优策略容易滞后。
二、融合数据中心三大资源区
当前一些新兴的应用,如区块链、工业仿真、人工智能、大数据等,基本都建立 在云计算的底座中。近些年,企业各类业务上云的步伐不断加速,云可以提供按需自助服务、快速弹性伸缩、多租户安全隔离、降低项目前期投资等价值优势。另外,在企业的数字化转型中,以金融和互联网企业为代表,大量的应用系统逐 渐迁移到分布式系统上,也就是通过海量的 PC平台来替代传统的小型机。这么做带来了高性价比、易扩展、自主可控等好处,但分布式系统架构同时也带来了服务器节点之间大量的网络互通需求。
以太网已经成为云化分布式场景中的事实网络标准:
- 以太网已具有很高的开放性,可以与各种云融合部署、可被云灵活调用管理。
- 以太网具有很好的扩展性、互通性、弹性、敏捷性和多租户安全能力。
- 以太网可以满足新业务超大带宽的需求。
- 以太网从业人员多,用户基础好。
而传统数据中心高性能计算使用的 IB 网络,以及集中式存储使用的 FC 网络,生态封闭,资源割裂,演进缓慢,已无法匹配云化的发展诉求。根据 IDC 数据显示,近年来 FC 和 IB 市场逐步萎缩,数据中心的云计算化趋势助长了对以太网的需求,以太网是当前以及未来主要的数据中心内部网络互联技术。
总的来说,IT 架构层面:从本地集中式走向云端 分布式。数据中心内存在三大资源区:通用计算区、高性能计算(HPC)区和存储区。
三个区域的逻辑图
通用计算区:与数据中心外部的用户对接,提供指定的应用服务。这个区域中的 服务器大量使用虚拟化、容器等技术,形成灵活的资源池来承载应用。本区域中的网络被称为应用网络、业务网络或前端网络,当前部署的是以太网。
高性能计算区:配备了专用的高性能单元(如 CPU、GPU)的服务器,完成指定 的高性能计算任务或 AI 训练。这个区域中的服务器一般很少使用虚拟技术。本 区域中的网络被称为高性能计算互联网络,当前部署的是 IB(InfiniBand)网络。
存储区:采用专用的存储服务器,对各类数据进行存储、读写和备份。本区域中 的网络一般被称为存储网络,通常部署的是 FC(Fibre Channel)网络。算力持续稳定的输出,离不开三大资源区的相互配合。作为联接数据中心各类资源的大动脉,数据中心网络承载着保障数据高效流通的职责。
数据流图
当前,通用计算区部署的传统以太网、高性能计算区部署的IB网、存储区部署的 FC 网,是三张异构网络,他们协议各异、架构割裂,带来了运维困难、专网生态封闭、成本高、无法实现全生命周期管理等问题。数据中心里这三张网络的融合,成为算力提升的必然要求。
很多厂家都提出超融合数据中心网络以全无损以太网来构建新型的数据中心网络,使通用计算、高性能计算、存储三大业务均能融合部署在同一张以太网上,同时实现全生命周期自动化和全网智能运维。
三、双活全以太存储网络实践
双活全以太存储网络,大幅提升存储性能。
在分布式存储场景,基于现代高性能数据中心交换机和相关智能无损算法,可感知流量的变化,并基于海量存储流量样本持续进行 AI 训练,智能动态地调整交换机的队列水线,实现亚秒级流量精准控制,确保100%吞吐下零丢包,IOPS(Input/output Operations Per Second,每秒进行读写操作的次数)提升 20-30%。
在集中式存储场景,除了对交换机水线的智能动态调整外,还实现了即插即用的存储网络:相比传统以太网中逐节点、逐零手工配置方式,可以做到业务单点配置、全网同步,实现存储设备的即插即用。
网络侧与存储侧的故障联动图
实现了网络侧与存储侧的故障联动,交换机毫秒级检测并通告故障,协同业务侧完成亚秒级的网络平面切换,实现网络中单点故障存储业务无感知。
好了,云超融合数据中心就介绍到这里了。懂技术就是有福气!关注我学习更多网络知识。