AI 语言模型产业的投资困境与发展困境分析

news2024/12/16 7:36:33

https://benn.substack.com/p/do-ai-companies-work

巨额投资与成本困境

大型语言模型(LLM)的开发成本惊人。根据报道,OpenAI 正在筹集 65 亿美元资金,每年约消耗 70 亿美元用于研究、开发新的 AI 服务和扩充团队。Anthropic 预计今年将投入 27 亿美元,而 Facebook 的投资规模更大。

虽然芯片性能可能提升、计算成本可能下降,摩尔定律仍在发挥作用,但模型优化的难度却在不断提高。这就像攀登珠穰:越往上走,空气越稀薄,每一步都比前一步更加艰难(AGI 可能会改变这种情况)。即使基础计算成本降低,但收益递减效应明显。2024 年要构建更好的模型,需要比 2023 年投入更多更复杂的计算资源。

市场竞争与价值衰减

尽管成本高昂,业界仍在持续开发新模型。人们相信 LLM 是下一个技术淘金热,最优秀的模型开发商将为员工和投资者带来巨额回报。这种追求更快、更高、更强的人性驱动力难以抗拒。

然而,旧模型的价值衰减速度惊人。用户可以轻易地从 GPT-3 切换到 GPT-4,仅需在 ChatGPT 中更改一个下拉选项。如果竞争对手推出更好的模型,用户只需修改几行代码就能完成迁移。要持续销售 LLM,就必须始终保持领先地位。

即使行业停止开发新模型,或者技术发展遇到瓶颈,旧模型的价值仍会快速衰减。开源模型如 Llama 和 Mistral 的能力与专有模型的差距并不大,如果专有模型停止进步,开源模型很快就能追赶上来。

产业困境与战略选择

对于 OpenAI、Anthropic 等 AI 厂商来说,他们面临两个选择:一是投入巨资保持市场领先地位,但这极其冒险,因为模型开发成本会持续上升,优秀员工可能离职,而且不能把业务建立在永远保持技术突破的基础上。技术优势很少能成为持久的护城河。第二个选择似乎只能是更加努力地实现第一个选择。

与云服务提供商的对比

18 个月前,有观点认为基础 LLM 供应商可能成为下一代云服务提供商。表面上看,这个类比似乎合理:两者都需要大量资金支持,都可能成为全球计算基础设施的重要组成部分,市场规模都可能达到数千亿甚至万亿美元。

但有一个重要区别:云服务提供商不会在短期内被取代。Azure 无需担心几位高管离职后在 18 个月内建立全球数据中心网络。AWS 虽然是互联网企业,但其竞争优势建立在物理世界中。可口可乐也是如此:核心配方固然重要,但创业公司无法在三个月内建立工厂、配送中心和零售网络。

AI 厂商的脆弱性

相比之下,AI 供应商的处境不同。虽然 OpenAI 需要大量计算资源,但这些都是租用的(来自微软、AWS 或 GCP)。只要有足够资金,任何人都能获取相同的资源。完全可以想象,一小组资深研究人员离开 OpenAI,筹集资金租用计算资源,在几个月内就能对 OpenAI 的核心业务构成威胁。

AWS 在数据中心上的投资构成了持久的防御,而 OpenAI 在开发 GPT 旧版本上的投资却不能,因为更好的版本已经在 Github 上免费提供。从某种意义上说,每个 LLM 供应商都随时可能在 18 个月内失去竞争力。(这对 AI 应用更为明显,如 Copilot、Poolside、Devin 和 Cursor 的更迭)

护城河之困

那么,LLM 供应商的护城河在哪里?是品牌?惯性?更好的应用生态?还是持续投入巨资保持技术领先?这个问题目前还没有明确答案。但 AI 公司似乎是市场错误地将软件开发成本视为一次性投资而非必要持续支出的极端案例。

对于谷歌、微软这样的巨头,以及已经成为 AI 代名词的 OpenAI 来说,这种持续投入可能是可行的。但对于尚未产生可观收入的小公司来说,即使通过大规模融资暂时领先,也很难持续保持优势。他们要么需要永续筹集巨额资金(市场需要保持非理性才能维持企业的生存),要么必须每年创造数十亿美元的收入,这是一个极高的生存门槛。

在这个市场中,时机可能是关键:当炒作退潮时,企业将无法获得如此规模的融资。最终的赢家不是跑得最快或者率先到达终点的人,而是在市场认定比赛结束时恰好领先的那个。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2260367.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

tryhackme——Pre Security(安检前)-Offensive Security(进攻性安全)

这里我用的edge的插件闪击翻译。这里我英语不好,所以用这个可以顺便学习下英语。 任务一:What is Offensive Security?(什么是进攻性安全?) 很简单啊,通过阅读,知道以下哪个选项更能代表您模拟黑客操作…

[论文阅读] |智能体长期记忆与反思

写在前面:10月份的时候,联发科天玑9400发布,搭载这款旗舰 5G 智能体 AI 芯片的荣耀MagicOS9.0实现了一句话让手机自动操作美团点咖啡。很快商场实体店里便能看到很多品牌手机已经升级为智能体语音助手。下一步,这些智能体或许便能…

CQRS Design Pattern in Microservices - CQRS模式

原文链接 CQRS Design Pattern in Microservices - GeeksforGeeks 【文章看起来像是AI写的。。。 😂😂😂】 简介 实现步骤 1,识别有界上下文:(Identify Bounded Contexts:) 2,命…

《拉依达的嵌入式\驱动面试宝典》—C/CPP基础篇(二)

《拉依达的嵌入式\驱动面试宝典》—C/CPP基础篇(二) 你好,我是拉依达。 感谢所有阅读关注我的同学支持,目前博客累计阅读 27w,关注1.5w人。其中博客《最全Linux驱动开发全流程详细解析(持续更新)-CSDN博客》已经是 Linux驱动 相关内容搜索的推荐首位,感谢大家支持。 《拉…

RPC远程服务调用详解和gRPC简介

RPC (Remote Procedure Call)是远程过程调用,比如说现在有两台服务器A, B,一个在A服务器上的应用想要调用B服务器上的应用提供的某个,由于不在两个方法不在一个内存空间,不能直接调用,需要通过网络表达调用的语义和传达…

计算机网络知识点全梳理(三.TCP知识点总结)

目录 TCP基本概念 为什么需要TCP 什么是TCP 什么是TCP链接 如何唯一确定一个 TCP 连接 TCP三次握手 握手流程 为什么是三次握手,而不是两次、四次 为什么客户端和服务端的初始序列号 ISN 不同 既然 IP 层会分片,为什么 TCP 层还需要 MSS TCP四…

PDFMathTranslate,PDF多语言翻译,批量处理,学术论文,双语对照(WIN/MAC)

分享一个非常实用的PDF文档翻译项目——PDFMathTranslate。作为一个经常逛GitHub的开发者,我总喜欢翻看各种项目附带的论文,虽然大多时候是瞎研究,但却乐在其中。该项目能够完美保留公式、图表、目录和注释,对于需要阅读外文文献的…

前端成长之路:CSS元素显示模式

元素显示模式 网页中的标签非常的多,在不同的地方会使用到不同类型的标签,了解这些标签的特点可以更好的布局我们的网页。 元素显示模式就是元素(标签)按照什么方式进行显示,比如:div标签会自己独占一行&a…

如何在 Ubuntu 22.04 上使用 vnStat 监控网络流量

简介 vnStat是一个免费的、开源的、基于控制台的Linux操作系统网络流量监控工具。通过vnStat,你可以在不同的时间段监控网络统计数据。它简单、轻量级,并且消耗的系统资源很小。vnStat允许你按小时、日、月、周和日生成网络流量数据。本教程将向你展示如…

解决pip下载慢

使用pip下载大量安装包,下载速度太慢了 1、问题现象 pip安装包速度太慢 2、解决方案 配置国内源 vi /root/.config/pip/pip.conf[global] timeout 6000 index-url https://mirrors.aliyun.com/pypi/simple/ trusted-host mirrors.aliyun.com

RabbitMQ中的Publish-Subscribe模式

在现代分布式系统中,消息队列(Message Queue)是实现异步通信和解耦系统的关键组件。RabbitMQ 是一个功能强大且广泛使用的开源消息代理,支持多种消息传递模式。其中,Publish/Subscribe(发布/订阅&#xff0…

专业140+总分410+浙江大学842信号系统与数字电路考研经验浙大电子信息与通信工程,真题,大纲,参考书。

考研落幕,本人本中游211,如愿以偿考入浙江大学,专业课842信号系统与数字电路140,总分410,和考前多次模考预期差距不大(建议大家平时做好定期模考测试,直接从实战分数中,找到复习的脉…

Unity类银河战士恶魔城学习总结(P178 Archer s arrow 弓箭手的箭)

【Unity教程】从0编程制作类银河恶魔城游戏_哔哩哔哩_bilibili 教程源地址:https://www.udemy.com/course/2d-rpg-alexdev/ 本章节制作了一个弓箭手的箭 Arrow_Controller.cs 1.OnTriggerEnter2D方法 功能:检测箭矢与其他对象的碰撞。逻辑&#xff1…

后端接受前端传递数组进行批量删除

问题描述:当我们需要做批量删除功能的时候,我们循环单次删除的接口也能进行批量删除,但要删除100条数据就要调用100次接口,或者执行100次sql,这样系统开销是比较大的,那么我们直接采用接收的数组格式数据sq…

ByteCTF2024

wp参考: 2024 ByteCTF wp 2024 ByteCTF WP- Nepnep ByteCTF 2024 writeup by Arr3stY0u 五冠王!ByteCTF 2024 初赛WriteUp By W&M ByteCTF 2024 By W&M - W&M Team ByteCTF Re WP - 吾爱破解 - 52pojie.cn 2024 ByteCTF - BediveRe_R…

Envoy 服务发现原理大揭秘与核心要点概述

1 Envoy动态配置介绍 动态资源,是指由envoy通过xDS协议发现所需要的各项配置的机制,相关的配置信息保存 于称之为管理服务器(Management Server )的主机上,经由xDS API向外暴露;下面是一个 纯动态资源的基…

转盘抽奖功能(附加代码)

写在开头 上期代码主要实现PC端电商网站商品放大效果,本期就来实现积分随机抽奖效果,开发久了很多功能都是通过框架组件库来完成,但是如果组件满足不了开发需求,还需要开发人员手动封装组件,专门出这样一期文章&#x…

【CSS in Depth 2 精译_075】12.2 Web 字体简介 + 12.3 谷歌字体的用法

当前内容所在位置(可进入专栏查看其他译好的章节内容) 第四部分 视觉增强技术 ✔️【第 12 章 CSS 排版与间距】 ✔️ 12.1 间距设置 12.1.1 使用 em 还是 px12.1.2 对行高的深入思考12.1.3 行内元素的间距设置 12.2 Web 字体 ✔️12.3 谷歌字体 ✔️12.…

ARM嵌入式学习--第七天(GPT)

GPT -介绍 GPT有一个32位向上计数器,定时计数器值可以使用外部引脚上的事件捕获到寄存器中,捕获触发器可以被编程为上升沿和下降沿。GPT还可以在输出比较引脚上生成事件,并在定时器达到编程值时产生中断。GPT有一个12位预分频器,…

搭建Tomcat(一)---SocketServerSocket

目录 引入1 引入2--socket 流程 Socket(应用程序之间的通讯保障) 网卡(计算机之间的通讯保障) 端口 端口号 实例 client端 解析 server端 解析 相关方法 问题1:ServerSocket和Socket有什么关系? ServerSocket Soc…