英伟达狂卖50万台GPU!AI爆火背后,是显卡的争夺

news2025/1/11 11:36:27

据市场跟踪公司Omdia的统计分析,英伟达在第三季度大约卖出了50万台H100和A100 GPU!

此前,Omdia通过英伟达第二季度的销售额,估计其大概卖出了900吨GPU!

大语言模型火爆的背后,英伟达建立起了强大的显卡帝国。

在人工智能的大潮之下,GPU成为了各机构、公司,甚至是国家在全球范围内争夺的对象。

图片

在本财年第三季度,Nvidia在数据中心硬件上获得了145亿美元的收入,比去年同期几乎翻了两番。

——这显然得益于随着人工智能和高性能计算(HPC)的发展而变得炙手可热的H100 GPU。

市场跟踪公司Omdia表示,Nvidia售出了近50万个A100和H100 GPU,庞大的需求量也导致了,基于H100的服务器需要36~52周的时间才能交付。

图片

从上图可以看出,Meta和微软是最大买家。它们各自采购了多达15万个H100 GPU,大大超过了谷歌、亚马逊、甲骨文和腾讯采购的数量(各5万个)。

值得注意的是,大多数服务器GPU都供应给了超大规模云服务提供商。而服务器原始设备制造商(如戴尔、联想、HPE)目前还无法获得足够的AI和HPC GPU。

图片

Omdia预计,到2023年第四季度,Nvidia的H100和A100 GPU的销量将超过50万台。

不过,几乎所有大量采购Nvidia H100 GPU的公司都在为人工智能、HPC和视频工作负载开发定制自己的芯片。

因此,随着他们转向使用自己的芯片,对Nvidia硬件的采购量可能会逐渐减少。

图片

上图统计了服务器的情况,2023年服务器出货量同比下跌了17%到20%,而服务器收入则同比上涨了6%到8%。

Omdia云和数据中心研究实践总监Vlad Galabov和数据中心计算和网络首席分析师Manoj Sukumaran预计,到2027年,服务器市场价值将达到1956亿美元,比十年前翻一番多。

随着大公司纷纷转向超异构计算,或使用多协处理器来优化服务器配置,服务器处理器和协处理器的需求将持续增长。

目前,就运行人工智能训练和推理的服务器而言,用于大型语言模型训练的最流行服务器是配置了8个H100/A100 GPU的Nvidia DGX服务器,以及亚马逊的配置了16个定制协处理器(Inferentia 2)的AI推理服务器。

而对于配备了许多定制协处理器的视频转码服务器,最流行的是拥有20个VCU(视频编码单元)的谷歌视频转码服务器,以及使用了12个可扩展视频处理器的Meta视频处理服务器。

随着一些应用的需求逐渐成熟,构建优化定制处理器的成本效益会越来越高。

媒体和人工智能会是超异构计算的早期受益者,之后数据库和网络服务等其他工作负载也会出现类似的优化。

图片

Omdia的报告指出,高度配置的人工智能服务器的增加正在推动数据中心物理基础设施的发展。

例如,今年上半年的机架配电收入比去年增长了17%,在需要液体冷却解决方案的趋势之下,数据机柜热管理收入有望在2023年实现17%的增长。

另外,随着生成式人工智能服务的普及,企业将广泛采用AI,而当前人工智能部署速度的瓶颈可能是电力供应。

热情的买家们

除了上面提到的巨头们,「民间」也有各种组织和公司纷纷采购NVIDIA的H100,以发展自己的业务,或者投资未来。

图片

Bit Digital是一家提供数字资产和云计算服务的可持续数字基础设施平台,总部位于纽约。公司已与客户签订条款,开展Bit Digital AI业务,为客户的GPU加速工作负载提供支持。

根据协议,Bit Digital将为客户提供最少1024个、最多4096个GPU的租赁服务。

同时,Bit Digital公司已同意购买1056块NVIDIA H100 GPU,并已支付了首笔定金。

图片

由美国公司Del Complex创建的BlueSea Frontier Compute Cluster(BSFCC)本质上是一艘巨大的驳船,包含 10000个Nvidia H100 GPU,总价值5亿美元。

图片

据路透社报道,一家名为Voltage Park的非营利组织以5亿美元的价格收购了24000个Nvidia H100芯片。

Volatage Park是一家人工智能云计算组织,由亿万富翁Jed McCaleb资助,计划为人工智能项目租赁计算能力。

Voltage Park提供的GPU价格低至每GPU每小时1.89美元。按需租赁的客户可以租用1到8个GPU,希望租用更多GPU的用户则需要保证一定的租赁期限。

与之相比,亚马逊通过8台H100的P5节点为用户提供按需服务,但价格要贵得多。

以8卡的节点来计算,AWS的收费为每小时98.32美元,而Voltage Park的收费为每小时15.12美元。

图片

在人工智能的热潮之下,英伟达也是雄心勃勃。

据英国《金融时报》报道,这家硅谷芯片巨头希望提高H100处理器的产量,目标是明年出货150万至200万台。

由于ChatGPT等大型语言模型的爆火,今年5月,Nvidia市值飙升,成功跻身万亿美元俱乐部。

作为开发大型语言模型的基础组件,GPU成为了人工智能公司,甚至是国家在全球范围内争夺的对象。

《金融时报》称,沙特阿拉伯和阿联酋已经购买了数千台英伟达的H100处理器。

与此同时,有富裕资金的风险投资公司,也忙着为投资组合中的初创公司购买GPU,以建立自己的人工智能模型。

图片

GitHub前首席执行官Nat Friedman和Daniel Gross曾支持过GitHub、Uber和其他许多成功的初创公司,他们购买了数千个GPU,并建立了自己的人工智能云服务。

这个名为仙女座集群(Andromeda Cluster)的系统,拥有2512个H100 GPU,能够在大约10天内训练出一个650亿参数的人工智能模型。虽然不是目前最大的模型,但也相当可观。

尽管只有两位投资人支持的初创企业,才能使用这些资源。此举还是受到了好评。

Anthropic的联合创始人Jack Clark表示,个人投资者在支持计算密集型初创企业方面所做的工作超过了大多数政府。

图片

相比于第三季度的145亿,第二季度,Nvidia售出了价值103亿美元的数据中心硬件。

对于这个成绩,Omdia曾作出估计:一个带有散热器的Nvidia H100计算GPU的平均重量超过3公斤(6.6 磅),而Nvidia在第二季度出货了超过30万台 H100,算下来总重量超过900吨(180 万磅)。

让我们把这900吨具象化一点,它相当于:

4.5架波音747 

11架航天飞机轨道飞行器

215827加仑水

299辆福特F150

181818台PlayStation 5s

32727只金毛猎犬

有网友对此表示:

图片

不过也有媒体觉得这个估计不太准确。因为Nvidia H100有三种不同的外形,重量也各不相同。

Nvidia H100 PCIe显卡重1.2千克,而带散热片的OAM模块的最高重量为2千克。

假设Nvidia H100出货量的80%是模块,20%是显卡,那么单个H100的平均重量约为1.84千克左右。

不管怎样吧,这都是一个惊人的数字。而且英伟达在第三季度的销量是显著增长的,如果按照50万块GPU每块2千克,那么总重量就是1000吨。

——现在的显卡都是按吨卖的了,不知道大家怎么看?

图片

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1282165.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

分治-归并排序

文章目录 🌞315. 计算右侧小于当前元素的个数🌈1. 题目⛅2. 算法原理🪐3. 代码实现 🌕493. 翻转对🌠1. 题目⭐2. 算法原理🌟3. 代码实现 🌞315. 计算右侧小于当前元素的个数 🌈1. 题…

深圳找工作的网站

深圳吉鹿力招聘网是一家在深圳做的比较好的招聘网站,提供一站式的专业人力资源服务,包括网络招聘、校园招聘、猎头服务、招聘外包、企业培训以及人才测评等。深圳吉鹿力招聘网在深圳的口碑相当好,是一个很好的选择。 深圳找工作用 吉鹿力招聘…

构建高效预约系统:深入探讨预约系统源码的设计和实现

随着各行业对高效资源利用和便捷服务的需求不断增加,预约系统成为了解决问题的有效工具。在这篇文章中,我们将深入研究预约系统源码的设计原则,并展示一些基本的技术代码,帮助读者更好地理解预约系统的实现方式。 设计原则 1. …

嘴尚绝卤味:健康卤味,未来餐饮市场的新星

随着人们生活水平的提高,对于吃的要求也越来越高。尤其是在快节奏的现代社会中,健康饮食成为了越来越多人的追求。在这种背景下,健康卤味这一新兴食品品类应运而生,成为了餐饮市场的新宠儿。 一、健康卤味的崛起 传统的卤味制作过…

「Verilog学习笔记」占空比50%的奇数分频

专栏前言 本专栏的内容主要是记录本人学习Verilog过程中的一些知识点,刷题网站用的是牛客网 根据题意7分频,实际上是第一次电平变化经历了4个上升沿3个下降沿,第二次电平变化是4个下降沿3个上升沿,所以用两个计数器就行了。分别对…

Git:修改最近一次 Git 提交的描述,使用 --amend 选项

目录 步骤1. 使用编辑器修改最近一次提交的描述 git commit --amend2. 在编辑器中修改描述3. 保存修改4. 如果提交包含文件修改5. 强制推送(如果已经推送到远程仓库) 步骤 1. 使用编辑器修改最近一次提交的描述 git commit --amend git commit --amend…

软考初级、中级、高级怎么选?

本年度的PMP考试已经结束啦,对于刚考完的威宝和已经通过考试的威班们来说,刚开始接触PMP认证的时候在科普阶段有看到过“软考”的字眼。什么是软考,它主要考什么?通常用于哪些方面?软考又和PMP有什么关系?如…

备战春招——12.3 算法

哈希表 哈希表主要是使用 map、unordered_map、set、unorerdered_set、multi_,完成映射操作,主要是相应的函数。map和set是有序的,使用的是树的形式,unordered_map和unordered_set使用的是散列比表的,无序。 相应函数…

CityEngine2023 shp数据城市与路网三维模型并导入UE5

目录 0 引言1 城市和道路数据获取1.1 常用方法1.2 OSM数据获取1.3 OSM数据格式1.3.1 所有格式1.3.2 Shapefile格式 2 实践2.1 导入数据(.shp)2.2 构建三维模型2.3 将模型导入UE5 🙋‍♂️ 作者:海码007📜 专栏&#xf…

mac M1芯片上编译车载aaos

一:mac上需要磁盘分区(支持大小写) mac分区: 在 Mac 上的“磁盘工具”中将物理磁盘分区 - 官方 Apple 支持 (中国) 注意:盘符名字不能有空格否则编译aaos时报错 注意:盘符名字不能有空格否则编译aaos时报…

2023.12.2 关于 Spring AOP 详解

目录 Spring AOP Spring AOP 常见使用场景 AOP 组成 切面(类) 切点(方法) 通知 ​编辑 前置通知(Before) 后置通知(After) 返回通知(AfterReturning&#xff0…

认识DHT11温湿度传感器并制作温度报警器

Arduino UNO Arduino IDE开发环境 Arduino DHT11温湿度传感器 ​ 一、认识Arduino的DHT11温度湿度传感器 DHT传感器由电容式湿度传感器和热敏电阻两部分组成。除此之外,模块内部还有一些模拟信号到数字信号的转换,将温度湿度以数字信号的方式输…

EPS地形图绘制技巧--快捷键

如何导入外业点数据? (1)打开EPS软件,新建一个工程。如下: (2)在【文件】-【输入输出】-【调入坐标文件数据】中,调入测量点数据,如下: (3&#…

asp.net_sql2008公司人事管理系统

登录模块 流程图: ◆ 职工输入用户名、密码并选择登录身份,根据选择的身份做不同的操作 ◎ 若选择的是“职工”,系统将查询数据库中的用户表Users的记录,用户名密码核对正确后加载职工主界面; ◎ 若选择的是“管理员…

Find My扩展坞|苹果Find My技术与扩展坞结合,智能防丢,全球定位

扩展坞又称端口复制器,是专为笔记本电脑设计的一种外置设备。通过复制甚至扩展笔记型计算机的端口,可使笔记本电脑与多个配件或外置设备(如电源适配器、网线、鼠标、外置键盘、打印机及外置显示器)方便的一站式连接。随着全球经济…

Perplexity发布两款LLM模型:pplx-7b-online和pplx-70b-online 可利用实时互联网数据查询

Perplexity AI,一家创新的人工智能初创公司,近日推出了一项能够改变信息检索系统的解决方案。该公司推出了两款新的大语言模型(LLMs),分别是pplx-7b-online和pplx-70b-online,标志着首次通过API公开访问在线…

C# OpenVINO 模型信息查看工具

目录 效果 支持模型 项目 代码 下载 C# OpenVINO 模型信息查看工具 效果 支持模型 ONNX format (*.onnx) PDPD (*.pdmodel) TF (*.pb) TFLite (*.tflite) 项目 代码 using Sdcb.OpenVINO; using System; using System.Collections.Generic; using System.Text; using…

docker部署typecho博客

文章目录 1.安装git2.安装compose3.拉取仓库4.创建目录5.配置文件修改6.启动容器7.修改MYSQL数据库8.安装成功9.参考GitHub文档 1.安装git 安装git yum -y install git2.安装compose (docker安装参考:docker基本知识) 确保已经安装了 Doc…

数组中第k个最大元素(优先队列)

class Solution { public:int findKthLargest(vector<int>& s, int k) {priority_queue<int> pq;for(int i 0; i < s.size(); i){pq.push(s[i]);}for(int i 1; i < k; i){pq.pop();}return pq.top();} }; priority_queue<int> pq为优先队列 s.s…

傅里叶变换及其在机器学习中的应用

​​​​​​​一、介绍 傅立叶变换是一种数学技术&#xff0c;在各个科学和工程领域发挥着关键作用&#xff0c;其应用范围从信号处理到量子力学。近年来&#xff0c;它在机器学习领域发现了新的意义。本文探讨了傅里叶变换的基础知识及其在机器学习应用中日益增长的重要性。 …