我们是否需要AI服务器?推动人工智能繁荣发展的AI服务器

news2024/12/29 9:41:47

揭穿人工智能服务器的炒作

人工智能的研究已经有几十年了,早在 1960 年代,生成式人工智能就已应用于聊天机器人。然而,2022 年 11 月 30 日发布的 ChatGPT 聊天机器人和虚拟助手席卷了 IT 界,让 GenAI 成为家喻户晓的术语,并掀起了开发人工智能相关硬件和软件的热潮。

通用 AI 和 GenAI 推动力开始增强的一个领域是 AI 服务器。分析公司 IDC 将 AI 服务器定义为运行专用于 AI 应用程序开发的软件平台、主要用于执行 AI 模型的应用程序和/或具有某些 AI 功能的传统应用程序的服务器。

我们是否需要AI服务器?推动人工智能繁荣发展的AI服务器

IDC 在 5 月份估计,到 2023 年,AI 服务器将占整个市场的 23% 左右,这一份额未来还将继续增长。IDC 还预测,到 2027 年,AI 服务器收入将达到 491 亿美元,前提是 GPU 加速服务器收入的增长速度将快于其他加速器的收入。

据供应商和销售商称,人工智能服务器和通用服务器之间的区别并不总是那么明显。

联想全球人工智能业务总监罗伯特戴格尔 (Robert Daigle) 表示,很多人在谈论人工智能服务器时,尤其是随着 GenAI 的蓬勃发展,都提到了富含 GPU 的系统,尤其是通常为训练和微调模型而设计的系统。

“[但] 还有很多用于 AI 工作负载的通用服务器,”Daigle 告诉我们。“当你脱离生成式 AI,甚至脱离深度学习,进入传统机器学习时,许多机器学习工作负载仍然在 CPU 上运行。”

Nor-Tech 是明尼苏达州伯恩斯维尔的一家定制系统构建商,也是 Nvidia 的顶级渠道合作伙伴,该公司既构建 AI 服务器,也销售其他制造商的模型。该公司工程副总裁 Dominic Daninger 告诉我们,AI 服务器基本上有两种类型,一种旨在进行训练,另一种在训练完成后旨在进行推理。

Daninger 表示,AI 服务器并不一定需要 GPU 来运行,但它们的性能比 CPU 好得多。

同时,他表示,还要注意的是,并非每台配备 GPU 的服务器都是以 AI 为重点的。诸如模拟模型或液体流动动力学之类的工作负载是使用 GPU 完成的,而不是 AI。

是否需要AI服务器?

加州圣何塞 Supermicro 高级副总裁 Michael McNerney 表示,人工智能服务器和非人工智能服务器之间的界限可能很微妙,取决于工作量。

McNerney表示:“我认为我们有八个不同的主要部分,从 LLM 大规模训练一直到边缘推理服务器,这些服务器将安装在工厂车间的杆式或壁式盒子上。”“我们确实看到人工智能几乎成为系统的一种功能,特别是当你深入到边缘时,这些盒子会根据其配置用于不同的事情。每台服务器在某个时候都可以成为 API 服务器,具体取决于它运行的工作负载类型。”

McNerney 表示,AI 是基于 GPU 的服务器上的主要工作负载,特别是那些通常用于 LLM 或大规模推理的最高配置的服务器,而中端机架式配置可以处理大多数推理工作负载。

Daigle 表示,联想拥有约 80 个经过认证的 AI 就绪服务器平台,可用于 GenAI 和广泛的 AI 领域。

“我们已经采取了一些措施,比如增加这些产品线对 GPU 和加速器的支持,并在它们上运行 MLPerf 等基准测试,以便客户能够看到这些系统的性能,以及我们如何提高性能并增强 AI 工作负载,”他说。“然后是我们在它们上运行的软件堆栈。我们的独立软件供应商生态系统中有 60 多家 AI 公司。这使我们能够实现 165 多种企业级 AI 解决方案。”

戴格尔表示,展望未来,人工智能服务器和通用服务器之间将继续存在界限。

“除了添加支持 AI 的基础设施外,客户还需要在其 IT 环境中支持大量传统工作负载,”他说。“因此,我认为除了扩展到 AI 之外,我们还将继续看到为这些传统 IT 工作负载设计的系统。”

展望未来,丹宁格表示,他预计英特尔和 AMD 将投资于以人工智能为重点的技术,但很难赶上英伟达。

“我们了解到的一件事是,Nvidia 在 CUDA 和真正实现 AI 所需的各种库上投入了大量精力,”他说。“此外,Nvidia 在硬件方面取得了巨大进步。英特尔或 AMD 等公司必须迅速采取行动才能在硬件方面击败 Nvidia,但另一个阻碍是开发所有代码以利用这些东西需要很多年。Nvidia 在这方面遥遥领先。”

McNerney表示,随着AI工作负载的增加,AI服务器集群变得非常重要,这将导致液体冷却的使用增加。

他说道:“我们认为,由于效率、性能和成本节省,在大规模集群空间中,使用液体冷却的部署比例将从不到 1% 上升至 30%。”

下来来看看来自多家服务器供应商和系统构建商的AI服务器样本。

联想 ThinkSystem SR780a V3

ThinkSystem SR780a V3 搭载 8 个 Nvidia H100/H200/B200 Tensor Core GPU,搭配两个第五代英特尔至强可扩展处理器和 32 个 DDR5 DIMM。Nvidia GPU 通过高速 NVLink 互连。该服务器包括联想 Neptune 液冷系统,该公司表示该系统比传统空气冷却更有效地散热,并允许 GPU 和 CPU 长时间以加速模式运行。ThinkSystem SR780a V3 可装入 5U 机箱中。

戴尔 PowerEdge R760xa

Dell PowerEdge R760xa 是一款专用服务器,采用双插槽、2U 风冷外形,支持各种 GPU。它以两个第四代或第五代英特尔至强处理器为中心,每个处理器最多有 64 个内核,并采用片上创新技术来增强 AI 和 ML 操作。该服务器最多有四个双宽 PCIe Gen5 加速器或最多 12 个单宽 PCIe 加速器,并支持 NVIDIA、AMD 和 Intel 的 PCIe GPU 适配器。该服务器提供最多 32 个 DDR5 内存 DIMM 插槽、Gen4 NVLink、PCIe Gen 5 和 E3.S NVMe SSD。

我们是否需要AI服务器?推动人工智能繁荣发展的AI服务器

超微 AS-4125GS-TNHR2-LCC

Supermicro 的 AS-4125GS-TNHR2-LCC 配备双插槽 AMD EPYC 9004 系列处理器和八个 Nvidia H100 GPU,通过 Nvidia NVLink 连接,体积紧凑,为 4U。该服务器面向 AI、深度学习和 HPC 应用,配备八个 PCIe 5.0 插槽和 24 个 DIMM 插槽,最多可容纳 6 TB 的 4800 ECC DDR5 内存。液冷可提高性能。

Nor-Tech 通用 GPU 服务器

Nor-Tech 的通用 GPU 服务器提供多架构灵活性和面向未来的开放标准设计,以提供先进且灵活的 GPU 服务器平台。服务器的模块化、基于标准的平台支持多种外形和组合的多种 GPU 技术,可用于大规模 AI 深度学习和 HPC 工作负载。这些 4U 服务器包括双第三代 Intel Xeon 可扩展或 AMD EPYC 7003 系列处理器、一系列行业标准 GPU 外形以及最多 10 个 2.5 英寸 NVMe/SATA 驱动器。可选的 1U 扩展模块可为高达 700 瓦的 GPU 和两个额外的 AIOM/PCIe 插槽提供更高的热容量。

HPE ProLiant DL385 Gen11 服务器

HPE ProLiant DL385 是一款 2U 双插槽服务器,配备第四代 AMD EPYC 9004 系列处理器和高达 6 TB 的 DDR5 内存和 36 个 EDSFF E3.5 NVMe SSD。这些服务器还可以容纳多达四个双宽或八个单宽 Nvidia L4、L40 或 L40S GPU。管理由 HPE GreenLake 提供,用于计算运营管理。

文章来源:我们是否需要AI服务器?推动人工智能繁荣发展的AI服务器-国外VPS网站

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1842914.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

CheckPoint 防火墙 CVE-2024-24919 VPN 漏洞修复说明

1. 漏洞说明 在 2024 年 5 月 27 日进行安全更新后,Check Point 的专门工作组将继续调查未经授权访问我们客户使用的 VPN 产品的企图。 2024 年 5 月 28 日,我们在远程访问 VPN 社区和移动访问软件刀片中使用 IPsec VPN 的安全网关中发现了一个漏洞 (…

海豚调度监控:使用图关系网络解决核心链路告警,减轻任务运维负担!

💡 本系列文章是 DolphinScheduler 由浅入深的教程,涵盖搭建、二开迭代、核心原理解读、运维和管理等一系列内容。适用于想对 DolphinScheduler了解或想要加深理解的读者。 祝开卷有益。大数据学习指南 大家好,我是小陶,之前分享了…

Python | Leetcode Python题解之第155题最小栈

题目: 题解: class MinStack:def __init__(self):self.stack []self.min_stack [math.inf]def push(self, x: int) -> None:self.stack.append(x)self.min_stack.append(min(x, self.min_stack[-1]))def pop(self) -> None:self.stack.pop()sel…

Java8 --- Gradle安装及测试使用

目录 一、Gradle 1.1、简介 1.2、安装 1.2.1、注意事项 1.2.2、安装流程 1.2.3、配置共享仓库 1.3、构建项目 1.4、常用指令 1.4.1、gradle classes 1.4.2、gradle clean 1.4.3、gradle test 1.4.4、gradle build 1.5、修改Maven下载源 1.6、Wrapper包装器 1.…

蓝牙模块在智能城市构建中的创新应用

随着科技的飞速发展,智能城市的概念已经逐渐从理论走向实践。物联网技术作为智能城市构建的核心驱动力,正在推动着城市基础设施、交通管理、环境监测等领域的深刻变革。蓝牙模块,作为物联网技术的重要组成部分,以其低功耗、低成本…

数据结构与算法-差分数组及应用

差分数组 差分数组: 其实差分数组是创建一个一个辅助数组,用来表示给定数组的变化,一般用来对数组进行区间修改的操作。 频繁操作数组区间的问题 假设我们要对一个数组进行区间操作。数组为 a {10,10, 20,20,50,… 100}。数组数据比较多。 对…

中新赛克两款数据安全产品成功获得“可信数安”评估测试证书

6月19日,2024数据智能大会在北京盛大召开。 会上,中国2024年上半年度“可信数安”评估测试证书正式颁发。中新赛克两款参评产品凭借过硬的技术水准和卓越的应用效果,成功获得专项测试证书。 2024年上半年度“可信数安”评估测试通过名单 中新…

SpringBoot集成logback初始化源码解析(部分)

一.SpringBoot配置扩展点 SpringBoot日志模块使用监听的方式进行初始化,在SpringBoot项目启动后,会通知日志监听器 在日志监听器中ApplicationStartingEvent事件用来确定到底使用哪个日志系统,logback log4j等 在日志监听器中ApplicationEn…

PFA氟树脂烧杯耐热无接缝带基准刻度量杯30/50/100ml

PFA量杯:可溶性聚四氟乙烯量杯、特氟龙量杯。主要用于痕量超痕量分析、同位素分析等实验室,是国内外洁净的实验室分析器皿。 量杯是上大下小的圆台形,底座宽台设计,保证稳定性,可在实验室中作为定量量取液体的量具&am…

HNU-计算机系统(CSAPP)实验三 BombLab

前言 BombLab来自《深入理解计算机系统》(CSAPP)一书的第三章“程序的机器级表示”的配套实验,该实验的目的是通过反汇编可执行程序bomb,来反推出程序执行内容,进而能够正确破解“密码”,拆除“炸弹”。 …

四川赤橙宏海商务信息咨询有限公司引领抖音电商潮流

在当今数字化浪潮下,电商行业蓬勃发展,抖音电商作为新兴力量,正以其独特的魅力吸引着越来越多的商家和消费者。四川赤橙宏海商务信息咨询有限公司,作为抖音电商服务领域的佼佼者,凭借其专业的团队和丰富的经验&#xf…

番外篇 | 基于YOLOv5-RCS的明火烟雾检测 | 源于RCS-YOLO

前言:Hello大家好,我是小哥谈。RCS-YOLO是一种目标检测算法,它是基于YOLOv3算法的改进版本。通过查看RCS-YOLO的整体架构可知,其中包括RCS-OSA模块。RCS-OSA模块在模型中用于堆叠RCS模块,以确保特征的复用并加强不同层之间的信息流动。本文就给大家详细介绍如何将RCS-YOLO…

新疆旅游创新产品迎活力 伊吾胡杨文旅品牌发布

2024年,随着政策的引领、经济的形态、社会需求的多样化以及新媒体流量的赋能,我国旅游业的主基调将从“快速复苏”转向“理性繁荣”,文旅产业正呈现出前所未有的活力和潜力。6月14日,“千年敦煌万年胡杨”敦煌至伊吾踩线采风行暨伊吾胡杨产品发布大会圆满落幕。会上,景区、旅行…

一名女DBA的感谢信,到底发生了什么?

昨日我们收到这样一通来电 “早上九点刚上班便收到业务投诉电话,系统卡顿,接口失败率大增,怀疑数据库问题。打开运维平台发现是国产库,生无可恋,第一次生产环境遇到国产库性能问题,没什么排查经验&#xf…

什么是Amazon Relational Database Service(Amazon RDS)及实践体验

目录 前言亚马逊云服务免费体验中心三种优惠类型 Amazon RDS什么是Amazon RDS为什么选择 Amazon RDS?Amazon RDS 的优势关键功能详情工作原理Amazon RDSAmazon RDS CustomAmazon RDS on Amazon Outposts 实践创建并连接到 MySQL 数据库实例一、创建 EC2 实例二、创建…

大型Web应用的模块化与组织实践:Flask Blueprints深入解析

目录 一、引言 二、Flask Blueprints概述 三、Flask Blueprints的使用 创建Blueprint对象 定义路由和视图函数 注册Blueprint 使用Blueprints组织代码 四、案例分析 创建模块目录结构 创建Blueprint对象 注册Blueprint 五、代码示例与最佳实践 1. 代码示例 …

成为AIGC人才,是职场人当下的必修课?

随着科技的飞速进步,人工智能和机器学习技术正逐渐渗透到我们生活的每一个角落,其中,人工智能生成内容(AIGC)更是以其独特的魅力和广泛的应用前景,成为当下科技领域的热门话题。在这样的背景下,…

数字乡村:绘就乡村振兴的智慧新画卷

在乡村振兴战略的宏伟蓝图下,“数字乡村”作为新时代农村现代化的重要抓手,正悄然改变着中国乡村的面貌。本文旨在深度剖析数字乡村建设的核心价值、关键技术、成功案例以及未来展望,为乡村振兴战略提供前瞻性的思考与启示。 数字乡村的核心价…

java.io.eofexception:ssl peer shut down incorrectly

可能是因为 1)https设置 2)超时设置 FeignConfig.java package zwf.service;import java.io.IOException; import java.io.InputStream; import java.security.KeyStore;import javax.net.ssl.SSLContext; import javax.net.ssl.SSLSocketFactory;import org.apac…

用电子表单替代纸质表格,签到报名、出入登记更轻松

用纸质表格收集信息时,常常会出现数据丢失、不易统计等问题。我们可以搭建电子表单来代替线下纸质表格,进行信息收集、记录数据。 这些数据会保存在账号下,可以导出Excel或PDF进行存档;也可以根据企业要求自定义PDF导出格式。 并…