谷歌、AMD、英特尔加入挑战,英伟达AI解决方案还能继续“遥遥领先”吗?

news2024/12/27 12:42:10

图片

 夕小瑶科技说 原创
 编译 | 谢年年

要问世界范围内人工智能解决方案谁最“遥遥领先”?

那肯定是英伟达!

图片

然鹅这一情况很有可能会发生变动。

谷歌正在构建自己的人工智能基础设施!

除了谷歌,在软件方面,Meta的PyTorch 2.0和OpenAI Triton同样发展迅速。

AMD的GPUs、英特尔的Gaudi、Meta的MTIA以及微软的Athena,它们的软件栈都处于不同的成熟阶段。虽然软件之间的差距仍然存在,但这个差距已经不像过去那么大了。

在接下来的几个月里,AMD的MI300和英特尔的Gaudi 3都将推出技术上优于英伟达H100的硬件。也许有一天,英伟达的遥遥领先地位将不复存在。

  大模型研究测试传送门

GPT-4传送门(免墙,可直接测试,遇浏览器警告点高级/继续访问即可):Hello, GPT4!

除了谷歌、AMD和英特尔,英伟达还需要警惕其他小型公司的竞争。这些公司虽然在硬件设计上落后,但他们背后的巨头公司会提供补贴。亚马逊即将推出他们的Trainium2和Inferentia3,微软也将很快推出Athena。

科技巨头们一直试图取代英伟达的位置,在这个市场分一杯羹。

英伟达早在几年前就预见了这种可能性,并启动了一项雄心勃勃且风险重重的多元化战略,尤其是他们在未来几年即将推出的H200、B100和“X100”GPU的硬件规划以及每年更新AI GPU的策略都具有重大意义。

下面这张图是英伟达未来发展计划的路线图:

由于来自谷歌、亚马逊、微软、AMD和英特尔的竞争压力,英伟达加快了B100和“X100”的计划。为了实现研发加速,AMD很有可能完全取消了他们的MI350X计划。

英伟达的目标不仅是超越传统的竞争对手如英特尔和AMD,更是希望能与科技巨头如谷歌、微软、亚马逊、Meta和苹果并驾齐驱。

接下来,让我们一起来看看英伟达在供应链的掌握情况和其他商业策略部署情况。

牢牢把握供应链

英伟达值得佩服的一点是,他们过去曾多次表明,即使在资源短缺期间也可以保证产品供应。

英伟达通过承诺不撤销的订单,甚至预付款项,确保了大量的供应来源。他们已经承诺购买了价值111.5亿美元的产品,承担了产能和库存的义务。此外,英伟达还签署了额外的38.1亿美元预付供应协议。

自英伟达创立初期,黄仁勋就积极推动供应链的发展,以实现英伟达的大规模增长目标。他曾经回忆起自己与台积电创始人张忠谋的早期会面。

1997年,我和莫里斯见面的时候,英伟达那年的收入达到了2700万美元,我们有100个员工。可能你们不会相信,莫里斯以前经常亲自打销售电话,甚至上门拜访客户。我会向他解释英伟达的业务,包括我们芯片的大小需求,以及它每年都会变得越来越大。他会定期回访英伟达,让我重复解释这些情况,以确保我真的需要那么多晶圆。次年,我们开始与台积电合作。英伟达的收入,我记得是1.27亿美元,从那时起,我们的年增长率近乎100%,一直持续到现在。实际上,过去10年我们的复合年增长率超过了70%。——黄仁勋与张忠谋的对话节选

图片

▲英伟达纪念张忠谋退休的漫画

当时,张忠谋难以相信英伟达需要如此多的晶圆。然而,黄仁勋坚定地持续下去,并抓住了当时游戏行业的巨大增长机会。英伟达在供应方面的大胆策略取得了巨大的成功,这通常都能为他们带来好结果。当然,他们不得不定期对价值数十亿美元的库存进行清理,但他们在过度订购的事务中仍然获得了积极的收益。

如果一种方法有效,为何要改变呢?

这次,英伟达已经把握了大部分如SK海力士、三星和美光HBM等GPU上游组件的供应。他们HBM供应商下了大量订单,导致整个市场货源供应紧张。

英伟达已经购买了台积电CoWoS的大部分供应。不仅如此,他们还进一步调查并购买了Amkor的产能。

英伟达充分利用了其HGX板或服务器所需的众多下游组件,包括定时器、DSP、光学器件等。对于对英伟达需求犹豫的供应商,英伟达通常会采取软硬兼施的策略。

一方面,供应商可以从英伟达那里获得看似无法想象的大订单;另一方面,他们也可能面临被英伟达从现有供应链中淘汰的风险。只有当供应商对英伟达至关重要,且无法被替代或找到多个来源时,英伟达才会提出不撤销订单的承诺。

所有供应商都认为自己在人工智能领域取得了胜利,部分原因是英伟达向他们大量订购产品。他们都以为自己占据了大部分业务,但实际上,他们是为英伟达的飞速发展提供巨大动力。

商业策略——潜在的反竞争

大家都知道,英伟达正利用对GPU的巨大需求,进行客户的追加销售和交叉销售。供应链中的许多消息源透露,英伟达会根据多渠道采购计划,制造自家的AI芯片的计划,以及购买英伟达的DGX、NIC、交换机和/或光学产品等多种因素,优先分配给某些公司。

像CoreWeave、Equinix、Oracle、AppliedDigital、Lambda Labs、Omniva、Foundry、Crusoe Cloud和Cirrascale这样的基础设施提供商,将优先享有大量的资源分配权。

英伟达的捆绑策略实施得非常成功。尽管他们之前只是一家规模较小的光学收发器供应商,但他们在一个季度内将业务扩大了两倍。他们预计在未来一年内,出货量将超过10亿美元。这个增长速度远超过他们的GPU或网络硅业务。

这些策略经过深思熟虑。例如,如果你想在Nvidia系统上实现可靠的3.2T RDMA/RoCE网络连接,唯一的方法就是使用Nvidia的NIC。因为英特尔、AMD和博通的竞争力不足,他们的技术仍然停留在200G。

幸运的是,英伟达成功地管理了供应链,使得他们的400G InfiniBand NIC的交货周期显著短于400G以太网NIC。请注意,这两款NIC(ConnectX-7)的硅和板设计是完全一样的。这主要归功于英伟达对SKU的配置,而非真正的供应链瓶颈。这种情况迫使公司选择购买英伟达更昂贵的InfiniBand交换机,而不是标准的以太网交换机。

除此之外,英伟达正在推动L40S的销售,以帮助原始设备制造商获得更多的H100配额。这些制造商面临着需要购买更多L40S的压力,以便得到更多的H100配额。这种策略与英伟达在PC领域的做法相同,即笔记本电脑制造商和AIB合作伙伴必须购买更多的中低端GPU(G106/G107),才能获得更稀有、利润更高的高端和旗舰GPU(G102/G104)的配额。

许多台湾供应链的人被告知,L40S的FLOPS更高,因此比A100更优秀。

这些GPU并不适合LLM推理。它们的内存带宽不到A100的一半,且没有NVLink。这就意味着,除了非常小的模型外,想要在这些GPU上以良好的总体拥有成本(TCO)运行LLM几乎是不可能的。大批量会导致每秒每用户的令牌数量不可接受,这使得理论上的FLOPS在LLM实践中变得毫无意义。

原始设备制造商(OEM)正面临着支持英伟达的MGX模块化服务器设计平台的压力。这个平台大大简化了服务器设计的复杂性,但同时也使其商品化,引发了更多的竞争,导致OEM的利润率下降。像戴尔(Dell)、惠普(HPE)和联想(Lenovo)这样的公司对MGX持有抵制态度。

然而,台湾的低成本公司,如SuperMicro、广达(Quanta)、华硕(Asus)、千兆(Gigabyte)、和硕(Pegatron)和ASRock,正急于填补这一空白,将“企业人工智能”低成本商品化。

有趣的是,这些参与L40S和MGX炒作游戏的原始设备制造商也可以更好地分配英伟达的主流GPU产品。

总结

在人工智能基础设施板块,谷歌、AMD、英特尔、亚马逊等巨头不甘落后,而英伟达也采取了多元化战略,誓要牢牢守住目前的地位。

未来的市场将会产生怎样的变化呢?我们拭目以待!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1098550.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

华为云云耀云服务器L实例评测|CentOS系统盘迁移到数据盘教程讲解

华为云云耀云服务器L实例评测|CentOS系统盘迁移到数据盘教程讲解 在华为云网购买华为云云耀云服务器L实例的Centos系统机器,可能会出现没有在挂载数据盘直接安装在系统盘情况,又或者系统初始化自动挂载在其他目录上。建议大家都把数据存放在数据盘下 …

CICD:Circle CI 实现CICD

持续集成解决什么问题 提高软件质量效率迭代便捷部署快速交付、便于管理 持续集成(CI) 集成,就是一些孤立的事物或元素通过某种方式集中在一起,产生联系,从而构建一个有机整体的过程。 持续,就是指长期…

如何养好一个微信新号?

最近听到一句话,“微信是个完整的互联网”。 你还真别说,真是。如果你还觉得微信只是个聊天视频打电话的工具,那可就有信息差了。 微信有各种各样的小程序,有打车的,有交话费的,有游戏,可以说&a…

【leetcode】260.只出现一次的数字Ⅲ

思路 由于只能使用线性时间复杂度。所以 遍历数组&#xff0c;将每个数字出现的次数存储到字典map中遍历字典&#xff0c;将次数为1的数字取出&#xff0c;就是答案 代码 #include<iostream> #include<vector> using namespace std; #include<map>class …

职场人的拖延症晚癌克星来啦 当当狸时间管理器

时间对于每个人都是公平的❗别说孩子对时间毫无观念&#xff0c;其实成年人又有几个对时间有观念呢&#xff1f; 总说时间不够用&#xff0c;却事事拖拉磨叽&#xff0c;拖延症严重的不仅是孩童&#xff0c;成人占据更多。 据调查显示超九成的职场人士都患有拖延症 拖延症的表…

vm虚拟机克隆ubuntu

1. 使用vm虚拟机自带的克隆功能 2. 选择完整克隆&#xff0c;然后选择您克隆到哪里的目录 3. 点击编辑你克隆后的虚拟机&#xff0c;点网络适配器&#xff0c;然后点高级&#xff0c;点击生成mac地址&#xff08;由于唯一&#xff0c;所以需要重新生成&#xff09; 4. 开启虚拟…

8+铜死亡+铁死亡+分型生信思路,多热点搭配

今天给同学们分享一篇铜死亡铁死亡联合分析的生信文章“Cross-talk between cuproptosis and ferroptosis regulators defines the tumor microenvironment for the prediction of prognosis and therapies in lung adenocarcinoma”&#xff0c;这篇文章于2023年1月17日发表在…

C++项目实战——基于多设计模式下的同步异步日志系统(总集篇)

文章目录 专栏导读项目介绍开发环境核心技术环境搭建日志系统介绍1.为什么需要日志系统2.日志系统技术实现2.1同步写日志2.2异步写日志 前置知识补充不定参函数C风格不定参函数不定参宏函数设计模式六大原则单例模式饿汉模式懒汉模式 工厂模式简单工厂模式工厂方法模式抽象工厂…

软件测试面试分享,纯干货,这拿不到20K?

前言 前面看到了一些面试题&#xff0c;总感觉会用得到&#xff0c;但是看一遍又记不住&#xff0c;所以我把面试题都整合在一起&#xff0c;都是来自各路大佬的分享&#xff0c;为了方便以后自己需要的时候刷一刷&#xff0c;不用再到处找题&#xff0c;今天把自己整理的这些…

Java 全栈体系(四)

第一章 Java 基础语法 十、IDEA 5. IDEA 中类的相关操作 5.1 类的相关操作 新建类文件 删除类文件 修改类文件 5.2 新建类文件 所有的 Java 代码都会写在 src 文件夹当中。 所以&#xff0c;右键点击 src&#xff0c;选择 new&#xff0c;点击 Java Class。 输入类名&…

Arcgis中像元值变化问题,拉伸显示的是否为实际像元值范围?

Arcgis中合并栅格但像元值变化 问题描述 这是四幅栅格&#xff0c;范围都在-1-9之间&#xff0c;怀疑这个范围是否是真实的范围。因为经常听到同学说放到arcgis拉伸显示之后&#xff0c;值变化了&#xff0c;所以研究一下。 原因 可以打开ENVI的像元快速统计工具&#xff…

Linux进阶-ipc管道

目录 ipc管道 无名管道pipe 头文件和函数原型 pipe.c文件 Makefile文件 执行过程 有名管道fifo 函数原型 fifo.c文件 Makefile文件 执行过程 FIFO的应用场景&#xff1a;Linux的日志系统 ipc管道 ipc信号&#xff0c;一个信号从进程中产生&#xff0c;发送给另一个…

Windows连接不上VMware,ping不通的问题

文章目录 防火墙问题Windows和虚拟机下的ip不一致导致的问题VMware Network Adapter (适配器)丢失的问题参考文档 防火墙问题 防火墙默认不会拦截ping命令&#xff0c;除非你个人设置了Linux防火墙Centos7的常用命令关闭防火墙 systemctl stop firewalld #停止Windows和虚拟机…

wordpress遇到的问题

一&#xff09; 403 Forbidden 我是lnmpwordpress&#xff0c;所以在 /etc/nginx/conf.d/default.conf中 修改location 加上 index.php刷新即可&#xff1b; 二&#xff09;wordpress插件更新&#xff0c;需要输入服务器的FTP登录凭证的问题 在 wp-config.php的文件中进行修改…

【C语言】——通讯录(静态-动态增长-文件储存)

目录 前言&#xff1a; 一&#xff1a;整体框架 关于通讯录结构体的创建 二&#xff1a;通讯录的功能实现&#xff08;静态&#xff09; 2.1初始化通讯录 2.2增加联系人 2.3打印通讯录 2.4删除联系人 2.5 查找联系人 2.6修改联系人 2.7排序联系人 三&#xff1a;通…

docker 复习

文章目录 docker 安装配置镜像加速器拉取镜像的仓库&#xff1a; docker 部署Mysql 镜像命令的详细解释docker 相关命令总结 docker 安装 查看是否安装的镜像已经在系统中存在&#xff1a; docker images &#xff08;存在2&#xff0c;不存在 3&#xff09; 卸载旧版本 yum r…

当出现“无法成功完成操作,因为文件包含病毒或潜在的垃圾软件“时的解决办法

安装补丁或其他安装包时,被系统识别为病毒垃圾 具体解决步骤是: 1.在开始菜单&#xff0c;打开Windows 安全中心 找到主页的病毒和威胁防护 找到管理设置 最后将确认安全的文件或安装包添加到排除项即可

Latex 通过\item控制编号

\item通常用于 1 论文写作中的hightlight 2 或一些需要缩进的场景 具体实现 \item 或\item[]在方括号里面添加1&#xff09;、 (1)来控制

Ubuntu系统搭建及环境部署

Ubuntu系统搭建及环境部署 1 制作系统&#xff08;系统盘安装&#xff09;1.1 选择版本&#xff0c;并下载1.2 刻录系统盘1.3 制作系统 2 配置2.1 root登陆2.2 更新国内源 1 制作系统&#xff08;系统盘安装&#xff09; ubuntu中文官网 1.1 选择版本&#xff0c;并下载 在官…

canvas画一个笑脸和画一个三角形

画一个笑脸主要用到的是画弧形的方法&#xff1a;arc&#xff0c;有五个参数&#xff1a;起始坐标&#xff0c;半径&#xff0c;弧形起始坐标&#xff0c;还有一个参数是顺时针还是逆时针。画的笑脸&#xff1a;虽然丑了点&#xff0c;但是学习了 代码&#xff1a; <!DOCTY…