英伟达 (Nvidia) 最近的一个创新与比特和字节无关。这是一项液冷技术创新。英伟达即将推出的 GB200 服务器机架将主要通过在硬件管道里循环的液体、而不是空气来冷却,该机架包含英伟达下一代 Blackwell 芯片。
英伟达发言人表示,该公司还在与供应商合作开发其他冷却技术,包括将抽屉大小的整个计算机浸入可吸收和散发热量的不导电液体中。
液冷已成为高端游戏电脑的常见配置,但在更大规模应用方面,传统上液冷仅用于解决最大的问题,例如核电站。
冷却系统泄漏是最大的风险。“但凡有一滴水滴到服务器上,比如价值数百万美元的 GB200,就可能造成灾难性的破坏”,力致科技股份有限公司 (Forcecon Technology) 总经理连春源表示,该公司与半导体制造商合作开发冷却系统。
摩根士丹利最近的一份报告显示,目前超过 95% 的数据中心使用气冷技术,因其设计成熟、可靠性高。
Super Micro Computer 首席执行官梁见后说,Super Micro 将在明年交付的约 30% 的机架中使用液体冷却技术。他说,6 月和 7 月份该公司交付了 1,000 多个液冷 AI 机架,占全球新数据中心部署的 15% 以上。Super Micro 表示,其液体冷却系统使数据中心的功耗降低了 30% 至 40%。英伟达表示,液冷数据中心可以在相同的空间内容纳两倍的计算硬件,因为气冷芯片在服务器上需要更大的空间。
英伟达既制造自己的服务器,也向其他服务器制造商供应芯片,这些制造商为开发 AI 应用的科技巨头制造设备。有关冷却技术的决策往往由这些公司共同做出。
据参与相关计划的人士透露,总部位于台湾的代工制造商富士康在台湾和墨西哥生产英伟达 GB200 系列方面发挥着主导作用。
冷却问题的敏感性在 7 月底凸显出来,当时社交媒体发帖称 GB200 的冷却系统存在泄漏,随后富士康和两家冷却部件供应商的股价下跌了 5% 以上。
据摩根士丹利估计,英伟达 GB200 的高端型号机架的液体冷却系统成本超过 8 万美元,约为现有搭载英伟达 H100 芯片的机架气冷系统成本的 15 到 20 倍。