全液冷服务器革命:CPU、内存、PCIe高效散热新方案

news2024/12/24 11:15:42

在国家十四五规划大力发展数字经济的背景下,数据中心作为算力的核心载体,其基础设施成为支撑数字经济的“数字底座”,但同时也面临巨大的碳排放压力。随着芯片与服务器功耗的上升,单机柜功率密度不断增大,传统风冷散热模式在换热性能和能耗优化方面逐渐受限。
在这里插入图片描述
液冷技术作为一种新兴的冷却方式,通过液态冷却工质带走发热元件热量,相比风冷具有更多优势,包括支持高功耗芯片解热、延长芯片寿命、降低数据中心PUE、提高换热效率、减少散热热点、支持更高机柜密度、降低噪声并提升环境适应性。因此,液冷技术在未来数据中心建设中的应用将成为制冷方向的重要组成部分,对于实现绿色算力和双碳目标具有重要意义。

全液冷服务器的节点由节点外壳、主板、CPU芯片、内存模组、内存冷板、CPU冷板,IO冷板,电源及电源后置换热器等组成。

1.CPU冷板设计

CPU冷板模组是基于英特尔第五代至强平台可扩展处理器冷板的设计要求,综合考虑散热,结构性能,成品率,价格及不同材质冷板设计兼容性等因素优化而成的一款CPU冷板参考设计,主要由CPU冷板铝支架,CPU冷板及冷板接头等部件组成。
在这里插入图片描述

2.内存液冷设计

内存液冷设计采用的是创新型的枕木散热器液冷方案,因内存插满如铁轨上的枕木而得名。它将传统风冷散热和冷板散热相结合,通过内置热管的散热器(或纯铝/铜板、VaporChamber等)把内存上的热量传递至两端,与冷板通过选定的导热垫片接触,最终通过冷板内的冷却工质把热量带走实现内存散热。

内存跟散热器可在系统外通过治具进行组装形成最小维护单元(下文称之为内存模组)。内存冷板上设计有内存模组固定结构可确保散热器和内存冷板之间良好接触,内存模组固定结构根据需要可以用螺丝固定或者无工具维护。内存冷板顶部给内存散热,底部则可以根据需要给主板其他发热元器件散热,比如VR,最大化利用内存冷板。为简化内存冷板设计,内存和主板之间可以设计转接支架来满足不同主板的限高区。
在这里插入图片描述
与市场上现有的管路(Tubing)内存液冷方案相比,枕木散热器液冷方案的主要优势有:
易于维护。内存维护时只需像维护风冷内存一样维护内存模组,无需将散热器和扣具取下,极大地提高了液冷内存组装效率和可靠性,降低了内存在系统内拆装时可能对内存颗粒和导热垫片造成的损伤。

**通用性好。**不同内存的颗粒厚度和内存间距不影响该方案的散热性能,该方案最小适应7.5毫米的内存间距,往上兼容。散热器和冷板解耦设计,可重复利用和内存液冷标准化。

**更高的性价比。**内存散热器可根据内存功耗选取不同的工艺和散热技术,且数量可根据内存按需配置。在7.5毫米内存间距情况下,即可满足30W以上内存的散热需求。

**易于制造和组装。**内存插槽之间没有液冷管路,无需复杂的管路焊接和工艺控制,可以采用传统风冷散热器和通用的CPU冷板制造工艺。组装散热器时,散热性能对散热器和主板在垂直于内存颗粒平面方向的公差不敏感,不会出现热接触不良,更容易组装。

**可靠性好。**枕木液冷方案避免了组装过程中可能对内存颗粒和导热垫片造成的损伤,并可满足多次插拔需求。此外,它还避免了内存和管路液冷散热方案安装后内存与插槽间由于倾斜而造成信号接触不良的风险,极大地提升系统可靠性。

3.硬盘液冷设计

创新的固态硬盘液冷方案是通过内置热管的散热器把硬盘区域的热量导出与硬盘区域外的冷板通过导热垫片垂直接触实现换热。

此固态硬盘液冷方案主要由装有散热器的固态硬盘模组,固态硬盘冷板,硬盘模组锁紧机构,及硬盘支架组成。硬盘模组锁紧机构固定在硬盘支架上提供合适的预紧力来保证固态硬盘模组和固态硬盘冷板的长期接触可靠性。为了方便硬盘冷板环路在狭小空间内的安装,硬盘支架在服务器深度方向采用了抽屉式的安装方式设计。
在这里插入图片描述
相比业界已有的硬盘液冷尝试,此方案的先进性主要体现在:
●可支持30次以上系统不断电热插拔
●硬盘安装过程中对导热界面材料无剪切破环风险,锁紧机构的设计可以保证长期的接触可靠性
●液冷散热方案对加工工艺要求低,只需采用传统的风冷和CPU冷板加工工艺
●硬盘间无水设计,多硬盘可供用同一冷板,减少了接头数量,降低漏液风险
●可灵活适配不同厚度和数量的固态硬盘系统

4.PCIe/OCP卡液冷设计

4.1 PCIe液冷方案
PCIe卡液冷方案是基于现有风冷PCIe卡,通过开发一款可以与系统冷板接触的PCIe卡散热模块来实现对光模块及PCIe卡上主要芯片的散热。光模块的热量通过热管传导到与PCIe卡主芯片上的散热模块主体,散热模块主体与IO冷板通过合适的导热界面材料接触实现换热。
在这里插入图片描述
液冷PCIe卡主要由QSFP散热板夹子、PCIe芯片散热模块及PCIe卡组成。QSFP散热板夹子要设计合适的弹性量,确保与PCIe散热模块上的QSFP散热板和笼子配合实现光模块安装时的合适浮动量,以保证良好的用户体验,避免损坏光模块,并实现良好的接触稳定性而达到预期的散热效果。

4.2 OCP3.0液冷方案
OCP3.0卡液冷方案跟PCIe卡类似,通过给OCP3.0卡定制一款液冷散热器,把卡上发热芯片热量传导到液冷散热器,最终通过散热器与系统IO冷板的接触把热量带走实现散热。

OCP3.0液冷模组主要由散热器模块,OCP3.0卡及其支架组成。锁紧机构由于空间限制采用了弹簧螺钉,以保证液冷OCP3.0卡组装后散热器模块与IO冷板之间的长期接触可靠性。
在这里插入图片描述
考虑到后期维护的便利性及OCP3.0卡的多次热插拔需求,锁紧机构的设计和导热界面材料的选型也做了很多优化来提高整体方案的可靠性及运维的便利性。

4.3 IO冷板方案
IO冷板是具有多功能的冷板,不仅仅实现主板IO区域内的发热部件的散热,也实现了液冷PCIe卡和液冷OCP3. 0卡的散热。
在这里插入图片描述
IO冷板主要由IO冷板主体和铜管流道组成。IO冷板主体采用铝合金材质,铜管主要承担冷却工质流道和加强散热的作用,具体设计需要根据主板布局及部件的散热要求进行优化。液冷PCIe卡及液冷OCP3.0卡上的散热模块与IO冷板沿箭头方向接触。冷却工质流道材料的选型需要考虑与系统管路冷却工质及浸润材料的兼容性。
在这里插入图片描述
此IO冷板液冷方案实现了多个部件在多维度的组装需求,铜铝材质的混合使用,解决了材料兼容性问题,保证散热效果,同时帮助减轻60%冷板重量并降低了成本。

5.电源冷板设计
电源液冷解决方案是在现有风冷电源的基础上通过外接一个风液换热器来冷却PSU风扇吹出的热风,以减少系统对外界数据中心环境的预热。

PSU后置换热器为多层结构,流道与鳍片相互叠加。PSU后置换热器的尺寸须在不影响电源线的插拔功能和满足系统机柜空间限制的条件下,平衡散热需求,重量及成本做出最优选择。PSU后置换热器独立组装在节点支架上。
在这里插入图片描述
此创新的电源液冷解决方案,无须重新开发新的液冷专用电源,缩短开发周期,降低开发成本;良好的通用性可以灵活适配多家厂商的电源方案,比定制化液冷电源节约成本60%以上。

针对于整机柜的应用场景,电源液冷还可以采用集中式风液换热器的解决方案,即对整机柜前后门进行封闭,在机柜底部布置一个集中式风液换热器,借助集中式结构替代PSU后置的分布式风液换热器结构。

集中式风液换热器是由喷涂亲水涂层强化换热的铝制波纹翅片,配合高换热系数铜管组成的换热器,可在能够在10℃温差下提供不低于8kW冷却能力;换热器流路仿真优化,在低阻下承载更多流量;具备防凝露设计和全方位漏液检测,杜绝安全隐患。采用特殊的铰链设计,满足高承重要求;同时卡盘式连接设计,方便安装,易于维护。

单台全液冷服务器超过95%热量均由冷板解热,仅有不足5%热量需要风液换热器解热计算,单个节点仅有40-50W风液解热量,单台集中式风液换热器支持8kW换热量,可支持不低于150节点的电源风液散热,且成本远低于150个分布式风液散热器价格。

利用该种方案,服务器电源可以不做任何改造,产生的热量在机柜后部由集中式风液换热器统一收集与热交换,同时该部分热量在机柜内形成自有循环,不会对机房环境造成任何影响,真正做到“Rack as a computer”。
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2059180.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

RF自动化环境安装+自动化实例解析

RF定义: 通用型的 自动测试框架, 绝大部分的软件的的自动化系统都可以采用它。 特点: 测试数据文件(Test Data)对应一个个的测试用例。测试数据文件里面使用的功能小模块叫关键字,由测试库(T…

【生日视频制作】教师节中秋节国庆节红色直升飞机AE模板修改文字软件生成器教程特效素材【AE模板】

红色直升飞机生日视频制作教程AE模板改文字广软件告生成器素材 怎么如何做的【生日视频制作】教师节中秋节国庆节红色直升飞机AE模板修改文字软件生成器教程特效素材【AE模板】 生日视频制作步骤: 安装AE软件下载AE模板把AE模板导入AE软件修改图片或文字渲染出视频…

字节跳远,AI绘梦:我的自由之旅,从编码到画布的奇幻转变

一、告别字节,开启未知旅程 在字节跳动的那些日子里,我经历了职场的起伏,也见证了公司的飞速发展。然而,高强度的工作节奏和不断攀升的业绩压力,让我开始思考生活的意义。最终,我做出了一个大胆的决定——裸…

Leetcode面试经典150题-300.最长递增子序列

解法都在代码里,不懂就留言或者私信 面试的话普通的动态规划解法就够了,如果要出彩,看看我提交的最终的解 class Solution {/**解题思路分析:这个题的普通解法是标准的动态规划对于每一个位置的值,看看前面所有的比它…

[数据集][目标检测]流水线物件检测数据集VOC+YOLO格式9255张26类别

数据集格式:Pascal VOC格式YOLO格式(不包含分割路径的txt文件,仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数):9255 标注数量(xml文件个数):9255 标注数量(txt文件个数):9255 标注…

分析Facebook在区块链技术中的应用与前景

随着数字技术的飞速发展,区块链作为一种具有去中心化、安全性高、透明度强等特点的技术,逐渐引起了各大科技公司的关注。Facebook(现Meta)也不例外,其在区块链技术上的探索不仅显示了对未来技术趋势的敏锐洞察&#xf…

周易测算系统开发:融合古典智慧与现代技术的创新实践

一、引言 周易,作为中国古代文化的瑰宝,蕴含着深邃的哲学思想与预测智慧,其独特的六十四卦体系及爻变原理,自古以来便被人们用于探索自然规律、人生哲理及未来趋势。随着科技的飞速发展,将周易智慧与现代计算机技术相结…

虚幻5|AI行为树,跟随task(非行为树AI)

这个可以不需要行为树 1.打开ai的角色蓝图后,添加一个函数,命名为跟距离改变速度 并用tick调用 2.编辑函数

python实现自动化生成pdf报告

easypdf使用手册 1. 项目介绍1.1 关于1.2 easypdf 有什么优势1.2 easypdf 可以用来做什么1.3 项目框架1.4 项目教程视频 2. 安装项目环境2.1 安装Python32.2在Windows上安装Python32.3 在Mac上安装Python32.4 在Linux上安装Python32.5 在Windows上安装Pycharm2.6 在Mac上安装Py…

Funsound语音识别技术之 基于paraformer的自定义命令(唤醒)词识别

免费语音识别转写(优于讯飞):www.funsound.cn 前言 Paraformer在声学后验上通过greedy search得到语音识别结果,对于自定义命令(唤醒)词识别,肯定还得走asr模型。对此我们可以在paraformer上为…

基于Java爬取微博数据(五) 补充微博正文列表图片 or 视频 内容

基于Java爬取微博数据五 补充微博正文列表图片 or 视频 内容 数据分析补充图片 or 视频执行结果 在通过对微博正文内容中的图片 or 视频内容进行分析后,图片 or 视频 链接是可以直接通过 Java 代码下载或者转存的,那么这样就可以补充我们在 【基于Java爬…

差旅费太高是什么原因?BI大神带你一起实操财务数据分析!

在数字经济的大潮中,数据已不仅仅是冰冷的数字,而是企业决策的活水源头。对财务来说,每一笔账目,每一次报销,都可能是企业健康的晴雨表。而随着数字化时代的到来,BI分析在财务数据管理中发挥着越来越重要的…

一、Socket介绍(也叫套接字)

一、定义 通过IP地址或者端口 将两个电脑连接起来; Socket是网络通信最常用的,除了这个还有HTTP; Http是一个弱联网;Socket用于长连接,使用的是Tcp; 除了这个还有一个SuperSocket,是对Socket…

初识spring security (一),一文弄懂默认配置

一、简单导入依赖 1、导入pom <parent><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-parent</artifactId><version>2.6.2</version></parent><modelVersion>4.0.0</modelVersion&g…

伺服电机抖动的解决方案

一、电机运行过程中抖动 1.原因分析 ①增益参数设置不当&#xff1a;增益参数不合适导致系统过于敏感&#xff0c;出现振荡&#xff1b; ②机械共振&#xff1a;机械系统的固有频率与电机运行频率接近&#xff0c;导致共振&#xff1b; ③反馈信号噪声&#xff1a;反馈装置…

KPaaS业务集成扩展平台是什么?有哪些功能?有哪些企业使用了?

KPaaS业务集成扩展平台是什么&#xff1f; KPaaS是由深圳市金众诚科技有限公司推出的&#xff0c;面向中小企业组织的一款企业数字化一站式业务集成扩展平台。 平台采用先进的微服务架构&#xff0c;基于Spring Boot和Spring Cloud技术&#xff0c;集成了Swagger、NGINX、Sen…

国内智能车零部件头号玩家引望:年出货300万套,估值1150亿

作者 |德新 编辑 |王博 8月19日&#xff0c;长安汽车发布公告&#xff0c;其联营企业阿维塔科技在当日的董事会上&#xff0c;通过了对引望公司的投资方案议案。 阿维塔将在8月20日与华为签约&#xff0c;阿维塔将出资115亿元&#xff0c;对引望公司持股10%&#xff0c;华为持…

jmeter简单发送接口

一、安装jmeter 拥有java环境&#xff0c;再下载jmeter 安装之后解压到本地&#xff0c;jmeter中的bin目录配置到环境变量中 之后可以通过cmd中 jmeter.bat命令运行 二、利用jmeter发送接口请求 1、添加线程组 添加->线程->线程组 2、添加http请求 添加->取样器-&g…

Yolov10网络详解与实战(附数据集)

文章目录 摘要模型详解模型实战训练COCO数据集下载数据集 COCO转yolo格式数据集&#xff08;适用V4&#xff0c;V5&#xff0c;V6&#xff0c;V7&#xff0c;V8&#xff09;配置yolov10环境训练断点训练测试 训练自定义数据集Labelme数据集格式转换训练测试 总结 摘要 模型详解…

Tiktok和Facebook广告哪个效果更好?

Tiktok广告作为新兴的数字营销工具&#xff0c;以其独特的短视频格式在全球范围内迅速获得了广泛的受众关注&#xff0c;如今已经和Facebook并列成为了社交媒体营销广告的两巨头&#xff0c;刚开始做海外社交媒体广告的朋友可能会纠结&#xff0c;这两者哪个的广告效果更好&…