InfiniBand、UCIe相关思考
- 内容1、InfiniBand
- InfiniBand是什么?
- InfiniBand的来历是什么?
- InfiniBand为什么重要?
- InfiniBand相较于Ethernet区别?
- 同领域内还有其他哪些技术?
- InfiniBand中RDMA是种什么技术?
- 内容2、UCIe
- 背景
- 目标
- 参考文献
内容1、InfiniBand
InfiniBand是什么?
用于高性能计算的计算机网络通信标准
InfiniBand的来历是什么?
上世纪90年代早期, 英特尔公司率先在标准PC架构中引入PCI。不够用时,英特尔、微软、SUN公司主导开发了“Next Generation I/O(NGIO)”技术标准。而IBM、康柏以及惠普公司,则主导开发的“Future I/O(FIO)
1999年,FIO Developers Forum和NGIO Forum进行了合并,创立了InfiniBand贸易协会(InfiniBand Trade Association,IBTA)。诞生的目的就是为了取代PCI总线,并引入了RDMA协议。
十年前IBTA的实际领导者是以色列公司迈络思Mellanox,2019年被Nvidia收购了。英伟达CEO说:“我们专注于加速计算(accelerated computing),而Mellanox专注于互联和存储。””
InfiniBand为什么重要?
1、时间长。从2001年开始发展,距今已有20多年。
2、产品积累多。目前ChatGPT用的网络就是英伟达基于InfiniBand开发的。
InfiniBand相较于Ethernet区别?
1、技术原理:InfiniBand采用了一种基于独立的双向数据通道(双线)和专用的硬件协议,以实现高速、可扩展和可靠的数据传输。而以太网基于共享介质和分组交换技术,广泛应用于局域网和互联网,并通过TCP/IP协议栈提供灵活的通信。
2、性能:InfiniBand 更高的带宽,更低的延迟
3、应用:InfiniBand用于HPC,Ethernet用于一般企业设备互联
4、成本:InfiniBand硬件成本高,Ethernet经济实惠
同领域内还有其他哪些技术?
IBM的BlueGene、Cray,还有Intel的OmniPath,都属于第二阵营
InfiniBand中RDMA是种什么技术?
数据直接通过RDMA通信,不经过核心内存转发
内容2、UCIe
背景
超以太网联盟 (Ultra Ethernet Consortium,UEC) ,UEC 的创始成员包括 AMD、Arista、博通、思科、Eviden 、HPE、Intel、Meta和微软,都拥有数十年的网络、人工智能、云和高性能计算大规模部署经验
目标
1、技术。一个完整的通信栈,解决跨越多个协议层的技术问题,并提供易于配置和管理的功能。
2、商业。挑战NVIDIA的InfiniBand在AI芯片设计领域的统治地位。
参考文献
Introduction to InfiniBand
InfiniBand wiki