人工智能(AI)技术的快速发展下,AI集群的计算能力和数据传输需求不断提升。为了满足这一需求,光模块技术也在不断进步。高速率光模块作为新一代高速光通信解决方案,正在逐步应用于AI集群中,为其提供更高效、更稳定的数据传输能力。智算中心机房内互联的光模块端口速率已到800G,持续向高速率(1.6T/3.2T)演进中。
未来五年AI集群中以太网光模块需求预测
早在23年7月,光通信行业内研究机构LightCounting(以下简称LC)就发布了《超级数据中心光学报告》,报告中指出未来5年用于AI集群的以太网光模块总销售额将达到176亿美金,占到了所有以太网光模块市场38%。报告预测2023、2024、2025全球以太网光模块市场规模分别为52亿、65亿、83亿美元左右,较去年Q1的报告分别上调了8%、25%、43%左右,可以看到绝大部分的增量来自AI集群需求,该机构认为AI集群应用将掀起一场全新的光学产品需求浪潮。
同时,LC还表示大型企业AI系统的新设计需要更多光学器件,未来两年头部企业网络的部署可能需要200万个400G SR4和600万个800G SR8光模块。对此,LC大幅上调了2024&2025以太网光模块市场预测,如果加上头部企业的新增需求,数通光模块市场弹性巨大。超以太网联盟成立瞄准高性能AI集群网络,以太网AI光模块和应用前端网络升级将构成光通信行业头部企业以外的市场驱动力。
AI集群中高速光模块的发展应用
在AI应用中,数据量的激增对光互联技术的带宽提出了更高要求。目前,许多使用400G SR4 和 800G SR8光模块构建的短距离链路都采用工作速率为106Gb/s的VCSEL激光器,而下一步的技术演进则是将光通道单lane速率提升到200G/lane,配合4路光通道数量,进一步降低800G模块的成本和功耗;并同步演进到单模块带宽到1.6T(8通道光路)。
在AI集群中,400G SR4光模块常用于服务器与交换机之间的连接。由于AI训练和推理过程需要大量的数据传输,高速且稳定的网络连接至关重要。400G SR4光模块能够提供足够的带宽和低延迟的传输环境,确保AI模型训练和数据处理的高效进行。800G SR8光模块主要用于超大规模AI集群和数据中心的核心网络连接。随着AI模型的复杂度和数据量的增加,800G SR8光模块能够提供所需的高带宽和低延迟连接,支持海量数据的快速传输和处理。
AI场景下的光互联技术创新
低功耗和低时延是光互联技术不可或缺的特性。低功耗意味着更少的能源消耗和更低的运行成本,而低时延则意味着更快的响应速度和更高的数据处理效率。为了满足这些需求,光互联技术需要在设计上进行优化,以减少能量损失和提高传输效率。
AI对系统的稳定性要求极高,因此光互联技术必须具备高可靠性。这要求我们在系统端到端的设计上进行优化,以确保数据传输的稳定性和可靠性。同时,我们还需要关注LPO的可演进性和互联互通性,以适应AI技术不断发展的需求。
除此之外,光互联技术的智能运维也变得越来越重要。智能运维不仅可以帮助企业实时监控系统的运行状态,还可以根据数据分析进行预测性维护,提高系统的可用性和稳定性。此外,智能运维还可以帮助我们优化资源配置,提高系统的整体性能。
随着速率的提升和单模下沉的加速,硅光技术预计将迎来高速增长。硅光技术以其高速、低功耗、小型化等优势,在AI场景下的光互联技术中发挥着越来越重要的作用。我们有理由相信,在未来的AI应用中,硅光技术将扮演更加重要的角色。
部分资料来源:LightCounting