10,000,000只800G光模块市场需求,你准备好了吗?

news2024/12/28 1:48:56

从今年5月起,各行业关于800G光模块的新闻此起彼伏,不断被讨论。华工正源、中际旭创、Coherent等公司纷纷发布公告提交业绩/投资调研会议记录,光迅6月也发布公告解释为何其股票突然大幅增长。到底是发生了什么事情,造成如此大的轰动?

市场背景

原来,这都源于今年5月中旬,NVIDIA发布了面向AI的DGX GH200,结合ChatGPT爆火所带来的广阔AI市场,这一系列连锁反应,点燃了AI算力时代。据source photonics提供的数据得知,一个AI/ML集群就需要180支800G光模块,1:1收敛比,则还需要320支800G光模块。而ChatGPT运行所需要的800G光模块更是高达10万支。为推动行业发展,谷歌、Meta、微软等各大互联网巨头纷纷加入AI市场,800G光模块订单纷至沓来。

800G光模块

目前的800G光模块,主要就是旭创和Finisar为主的,多模光模块数量大,单模数量小。今年年初需求量在300万支左右,预计今年后半年,需求量会翻倍,到2024年时,800G光模块市场需求量会达到千万级别。

这只是一个行业预估,一方面,大家的产能还在初期的阶段,早两三年,各家的800G Demo就已经在演示了,今年OFC更多的是200G EML的内容,800G光模块产业化,第一步是8x100G,未来是4x200G,再接下去就是8x200G的1.6T光模块。

光模块应用

AI应用网络架构

H100最新架构试算:8个节点(单服务器),NVLink下需要18对、36个osfp,也就是36个800G一个POD集群需要36x32=1152个800G光模块。若需要InfiniBand网络,则是传统叶脊双层架构,需要800G或2x400G ( NDR),数量关系与普通集群差异不大,依据不同规模可另外计算。

DGX H100拓扑架构

DGX GH200

在应用场景上DGX GH200与DGX H100无异,可参考DGX H100应用。但在算力上,DGX GH200却提升了数倍,甚至数百倍。NVIDIA Grace Hopper Superchip 与 NVLink 交换系统,在 NVIDIA DGX GH200 系统中集成多达 256 GPU 。在 DGX GH200 系统中, GPU 共享内存编程模型可以通过 NVLink 高速访问 144 TB 的内存。与单个相比NVIDIA DGX A100 320 GB 系统, NVIDIA DGX GH200 通过 NVLink 为 GPU 共享内存编程模型提供了近 500 倍的内存,形成了一个巨大的数据中心大小的 GPU。NVIDIA DGX GH200 是第一台突破 NVLink 上 GPU 可访问内存 100 TB 障碍的超级计算机。

GPU NVLink

800G产品应用场景

光模块应用场景

1. 800Gb/s 交换机到交换机或到两台 400Gb/s 交换机

可以使用两个双端口 OSFP 光模块和两根直通多模光纤跳线以800G (2x400G) 将两台基于 OSFP 的交换机链接在一起(50米)。此外,两根光缆可以路由到两个不同的交换机,形成两条 400Gb/s 链路。然后可以将额外的双端口OSFP端口路由到更多交换机。

800G SR8 应用

2. 800Gb/s 交换机到2x 400G ConnectX-7 和/或 BlueField-3

使用两根光纤跳线的双端口 OSFP 光模块最多可支持两个适配器和/或 DPU 组合。两条 4 通道光纤跳线中的每一条都可以连接到 OSFP 或 QSFP112 封装的 400G 光模块,最长可达 50 米。单端口 OSFP 和 QSFP112 封装的光电性能和光接口相同,功耗为 8 W。

-仅 ConnectX-7/OSFP 支持单端口 OSFP。

-QSFP112封装光模块可用于ConnectX-7/QSFP112和/或BlueField-3/QSFP112 DPU。

使用 OSFP 或 QSFP112 的 ConnectX-7 和 BlueField-3 的任意组合可同时与双端口 OSFP 光模块链接使用。

800G SR8应用

800G DR8应用

3. 800Gb/s 交换机到4x 200G ConnectX-7 和/或 BlueField-3

使用两根 1:2 分支光纤跳线的双端口 OSFP 光模块最多可支持四个适配器和/或 DPU 组合。两根 4 通道 1:2 分支光纤跳线中的每根都可以连接到 OSFP 或 QSFP112 封装的 400G 光模块,传输距离长达 50 米。单端口 OSFP 和 QSFP112 封装的光学性能和光接口相同。在 400G 光模块中仅激活其中的两个通道,从而实现 200G 应用,并能将 400G 光模块的功耗从 8 W降低到 5.5 W。双端口 OSFP 功耗保持在 15 W。

-仅 ConnectX-7/OSFP 支持单端口 OSFP。

-QSFP112 封装光模块可用于 ConnectX-7/QSFP112 和/或 BlueField-3/QSFP112 DPU。

-ConnectX-7 和 BlueField-3 网卡的任意组合可同时与双端口OSFP 光模块 链接使用。

800G SR8应用

800GDR8应用

4. 800Gb/s 交换机到 DGX H100 GPU 系统

DGX-H100 在顶部机箱部分包含 8 个“Hopper”H100 GPU,在底部服务器部分包含两个 CPU、存储以及 InfiniBand 和/或以太网网络设备。其中包含八个 400Gb/s ConnectX-7 IC,安装在两个称为“Cedar-7”板卡的夹层板上,用于 GPU 到 GPU InfiniBand 或以太网网络。板卡 I/O 在内部路由至四个 800G 双端口 OSFP 机箱,内置散热器安装于前面板上的机箱顶部。这需要在 DGX H100 中使用flat-top transceivers、ACC 和 DAC 线缆。由于交换机中的气流入口减少,400G IB/EN 交换机需要使用finned-top 2x400G 光模块进行额外冷却。

Cedar-7 到交换机的链路可以是单模或多模光纤跳线 或 ACC 有源铜缆,并且采用 InfiniBand 或以太网。

每个双端口 2x400G 光模块提供两条从 DGX 到 Quantum-2 或 Spectrum-4 交换机的 400G ConnectX-7 链路。与 DGX A100 相比,这减少了 ConnectX-7 板卡冗余、复杂性和光模块数量,DGX A100 使用 8 个独立的 HCA 和 8 个光模块或 AOC 线缆以及两个用于 InfiniBand 或以太网存储的附加 ConnectX-6。

此外,对于存储、集群和管理的传统网络,DGX-H100 还支持多达四个 ConnectX-7 和/或两个 BlueField-3 DPU 在 InfiniBand 和/或以太网中用于存储 I/O,以及支持使用 OSFP 或 QSFP112 光模块的 400G 或 200G 设备进行的额外网络。这些 PCIe 卡槽位于OSFP GPU机箱的两侧,并使用单独的电缆和/或光模块。

800G SR8应用

800G DR8应用

线缆应用场景

1. 800Gb/s 交换机到交换机或到 DGX H100 GPU 系统

MCP4Y10 的主要用途是将两个双端口、基于 OSFP 的 Quantum-2 InfiniBand 或 Spectrum-4 以太网交换机相互链接在一起,最长可达 2 米,两端均为finned-top连接器。OSFP flat top(在部件号中指定为 -FLT)电缆端可用于液冷交换机和 DGX H100 系统,其中 flat top 用于 DGX H100,flat top 连接器用于 InfiniBand 或以太网交换机 。0.5m 至 2m 采用细 30AWG 线规,方便弯曲。

800G 1x1 DAC/ACC 应用

2. 800Gb/s 交换机到2x和4x 400G ConnectX-7 / QSFP112

单端口 QSFP112 与 ConnectX-7/QSFP112 网络适配器和 BlueField-3/QSFP112 DPU 配合使用。

800G 1x2和1x4 DAC 应用

3. 800Gb/s 交换机到2x和4x 400G ConnectX-7 / OSFP

单端口 OSFP 仅与 ConnectX-7/OSFP 网络适配器一起使用。

BlueField-3/QSFP112 DPU 和 ConnectX-7/QSFP112 适配器需要 MCA7J65 和 MCA7J75 上的 QSFP112 端。

800G 1×2 和 1x4 ACC 应用

演进路线

800G DR8 OSFP 演进路线

路线一:EML路线

EML激光器

800G DR8 OSFP光模块采用8颗100G EML激光器,激光器数量多,成本高,是目前技术最成熟的一个方案。未来有望实现800G DR4 OSFP,激光器数量减半,成本降低,长期有望接近400G光模块的价格。

路线二:硅光路线

硅光模块

800G硅光目前多采用双激光器驱动方案,复用了当前400G DR4方案。成本上要更低于EML方案。未来会发展为单激光器驱动方案,采用薄膜铌酸锂调制器降低光路损耗,可实现单颗CW激光器驱动8路光信号,目前还处于样品阶段,量产时间未定。硅光单激光器方案预计在2025年可实现量产,届时,800G DR8硅光模块在成本上会进一步降低,但目前主流还是双激光器硅光方案。

800G DR8硅光模块

800G 2xFR4 OSFP 演进路线

800G 2xFR4 OSFP演进路线

800G 2xFR4采用2套4波CWDM波长的100G EML激光器,每套包含4个激光器,未来会发展为FR4采用4颗CWDM波长200G EML激光器。因为800G FR4需要4个波长CWDM激光器,硅光方案将同样需要采用4个波长的CWDM激光器,因此硅光方案不具备成本优势,主流为EML方案,暂时没有厂商研究硅光方案。

800G SR8 OSFP 演进路线

800G SR8 OSFP演进路线

800G SR8采用8颗VCSEL激光器,传输距离为50m(OM3),由于距离端,应用场景较400G SR8受到更多限制。通过10G、25G、50G、100G SR光模块的传输距离对比,我们可以看到VCSEL激光器单通速率越高,它的传输距离几乎是对半减少的。随着光模块单通道速率越来越高,VCSEL进入到了瓶颈期。预计到1.6T光模块时代时,若1.6T光模块采用VCSEL激光器,距离还会进一步缩短,对于客户选择来说,1.6T的线缆方案在成本上会是一个更优选,所以预计未来VCSEL激光器会退出1.6T光模块市场。

从CPO到LPO

从CPO到LPO

CPO

相较于传统方案,通过上图可以看到,CPO方案减少了一颗DSP芯片,在功耗和成本上进一步降低。同时,CPO方案采用了光电共封装的形式,直接将交换芯片(实现光电转换功能的)封装到了光模块上,减少了交换机到光模块的电信号损耗,从而降低了时延和整体功耗。

由于光电共封装的原因,问题也因此产生了,由于要把交换机芯片封装到光模块上,那么这个封装由光模块还是交换机厂商来封装就成了问题,同时,如果坏了一个光电芯片组,怎么维修,谁来维修等,在技术上存在很多问题。因此,真正大规模量产应用至少3年以后,甚至可能长期在一个概念的状态。

LPO

作为传统方案的替代方案,LPO方案一经推出就收获了广泛关注。LPO方案采用LPO线性直驱的技术把DSP替换掉,使用高线性度、具备EQ功能的TIA和DRIVER芯片,功耗大幅降低。但是延迟提升,系统误码率和传输距离有所牺牲。因此,LPO暂时用于特定领域(短距离),但未来可能会用于500m以内,满足数据中心最大的需求。

LPO技术高度依赖交换机芯片性能的开放和提升,如T51.2T的Tomahawk 5在信号恢复方面的功能提升。整体上来讲,LPO作为光模块的一个封装形式,是可插拔光模块向下演进的技术路线,相较于CPO方案更容易实现、确定性更强。

总结

1.EML激光器方案将是800G光模块未来两年的主流方案,EML需求将会大幅增加。

2.硅光方案相比EML方案更具成本优势,但批量生产还面临一些挑战,长期可靠性还需要进一步验证。

3.下一代4X200G的800G光模块将会带来更大的成本优势,长期成本有望接近400G光模块。

4.LPO光模块具有功耗和成本优势,给用户带来价值,但面临诸多技术挑战,还需要一段时间进行沉淀。

飞速(FS)800G光模块产品规划

为更好的顺应行业发展趋势、满足用户增长的需求,飞速(FS)致力于在800G光模块领域长期发展,为此定制800G光模块产品未来规划。当前已有QSFP-DD光模块、OSFP光模块、QSFP-DD高速线缆、OSFP高速线缆等相关系列产品在售,后续也将通过研发及技术引入,进一步提升产品性能,扩展产品类型,构建完整的产品体系。

在产品规划和管理中,飞速(FS)将充分听取客户反馈并结合市场需求,持续进行研发和测试,为客户提供高性能、低功耗的800G光模块解决方案,推动数据通信技术的进一步发展。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/911263.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

爬虫异常处理:异常捕获与容错机制设计

作为一名专业的爬虫程序员,每天使用爬虫IP面对各种异常情况是我们每天都会遇到的事情。 在爬取数据的过程中,我们经常会遇到网络错误、页面结构变化、被反爬虫机制拦截等问题。在这篇文章中,我将和大家分享一些关于如何处理爬虫异常情况的经…

【操作系统】进程的基本概念进程的状态与转换进程的组织方式

🐌个人主页: 🐌 叶落闲庭 💨我的专栏:💨 c语言 数据结构 javaEE 操作系统 石可破也,而不可夺坚;丹可磨也,而不可夺赤。 操作系统 一、进程1.1概念1.2组成1.3特征 二、进程…

LLM生成式 AI 项目生命周期Generative AI project lifecycle

在本课程的其余部分中,您将学习开发和部署LLM驱动应用所需的技巧。在这个视频中,您将了解一个能帮助您完成此工作的生成式AI项目生命周期。此框架列出了从构思到启动项目所需的任务。到课程结束时,您应该对您需要做的重要决策、可能遇到的困难…

海外ios应用商店优化排名因素之应用名称

当我们的应用出现在搜索结果中时,用户会更详细地查看并转到我们的应用程序页面,引入页面视图,点击下载应用,或者是直接忽略。所以在获得曝光度之后如何决定完全取决于优化因素,例如应用图标、屏幕截图和视频预览以及其…

Leetcode74. 搜索二维矩阵

给你一个满足下述两条属性的 m x n 整数矩阵: 每行中的整数从左到右按非递减顺序排列。每行的第一个整数大于前一行的最后一个整数。 给你一个整数 target ,如果 target 在矩阵中,返回 true ;否则,返回 false 。 class…

Java学习笔记36

Java笔记36 网络编程 概述 计算机网络 计算机网络是指将地理位置不同的具有独立功能的多台计算机及其外部设备,通过通信线路连接起来,在网络操作系统,网络管理软件及网络通信协议的管理和协调下,实现资源共享和信息传递的计算机…

ssm汽车养护管理系统源码和论文

ssm汽车养护管理系统038 开发工具:idea 数据库mysql5.7 数据库链接工具:navcat,小海豚等 技术:ssm 开题报告内容:(研究现状、目的意义;基本内容、研究方法、参考文献等。) 研究现状 国外…

常见前端面试之VUE面试题汇总一

1. Vue 的基本原理 当 一 个 Vue 实 例 创 建 时 , Vue 会 遍 历 data 中 的 属 性 , 用 Object.defineProperty ( vue3.0 使 用 proxy) 将 它 们 转 为 getter/setter,并且在内部追踪相关依赖,在属性被访…

百度工程师浅析解码策略

作者 | Jane 导读 生成式模型的解码方法主要有2类:确定性方法(如贪心搜索和波束搜索)和随机方法。确定性方法生成的文本通常会不够自然,可能存在重复或过于简单的表达。而随机方法在解码过程中引入了随机性,以便生成更…

idea插件grep console最佳实践

首发博客地址 https://blog.zysicyj.top/ 参考博客:https://blog.csdn.net/ayunnuo/article/details/123997304 效果 配置 具体颜色 日志级别前景色背景色Error#FF0000#370000Warn#FFC033#1A0037Info#00FFF3无Debug#808080无 本文由 mdnice 多平台发布

python schedule库使用教程

schedule 是一个 Python 库,用于在指定的时间间隔或特定时间点执行任务。它可以帮助你创建定时任务,例如定时运行函数、脚本等。以下是一个简单的 schedule 库的使用教程。 安装 首先,你需要安装 schedule 库。你可以使用以下命令通过 pip …

ABBYY FindReader2024免费版电脑PDF格式扫描软件

在日常工作和生活中,我们有时需要将各种格式的文件转换为PDF格式,也可能需要将纸质文件扫描成PDF文档。今天要和大家分享的是PDF扫描软件哪个好,如何把多个扫描件合成一个PDF。 PDF作为目前主流的文件格式之一,在日常生活中我们需…

解决npm安装依赖失败,node和node-sass版本不匹配的问题

npm安装依赖报错: npm ERR! cb() never called! npm ERR! This is an error with npm itself. 一. 问题描述 用npm安装依赖报错: npm ERR! cb() never called! npm ERR! This is an error with npm itself. Please report this error at: npm ERR! …

记录一次wordpress项目的发布过程

背景:发布一套已完成的代码到线上,有完整的代码包,sql文件,环境是linux 宝塔。无wordpress相关经验。 过程:正常的发布代码 问题1:访问自己的域名后跳转到别的域名。 解决: 修改数据表wp_optio…

YOLOv8改进——引入可变形卷积DCNv3

YOLOv8 详解 ✨✨✨YOLOv8详解 【网络结构代码实操】 可变形卷积DCNv1 & DCNv2 ✨✨✨论文及代码详解——可变形卷积(DCNv1) ✨✨✨论文及代码详解——可变形卷积(DCNv2) DCNv3 是InternImage中提出的,DCNv3在DCNv…

centos7.6 firewalld防火墙配置

1、查看系统版本 cat /etc/redhat-release 2、查看防火墙运行状态 systemctl status firewalld 此处可以看到防火墙已开启。 3、关闭开机自启动防火墙 systemctl disable firewalld.service 4、启动防火墙并查看状态,系统默认 22 端口是开启的。 systemctl start f…

HCIP学习--企业网三层架构实验

一、实验拓扑 二、实验要求 内网IP地址172.16.0.0/16合理分配 SW1/2之间互为备份 VRBP/STP/LANTRUNK均使用 所有PC通过DHCP获取ip地址 三、实验步骤 首先思考进行IP地址的规划 配置eht-trunk [sw1]interface Eth-Trunk 0 [sw1-Eth-Trunk0]q [sw1-GigabitEthernet0/0/1]i…

魏副业而战:她的闲鱼号被封了

我是魏哥,与其躺平,不如魏副业而战! 社群小K的闲鱼号被封了。 什么原因呢? 卖书被举报了。 魏哥调侃说,别干了,放弃吧。 她不听,重新开搞…… 这就是真正的网络创业者该有的素养。 魏哥蛮…

安卓系列机型-禁止卸载某个APP 防止误卸载软件 无需root权限

安卓系列机型-禁止安装某软件 防止“沉迷游戏的小孩”操作解析_安卓机器的博客-CSDN博客 上一期讲了如何禁止安装某个app。今天讲下如何禁止卸载某app。正好相反的操作。任何操作有利有弊。主要看使用者如何对待使用。 💔💔💔以腾讯的一款游…

Jenkins自动化部署Vue项目

1、新建item,选择 Freestyle project 2、源码管理选择git,输入git仓库地址和授权账号,并指明要部署的分支 3、构建选择 Execute shell,输入vue项目打包命令 命令示例: source /etc/profile node -v npm config set re…