有人泼冷水:为什么AI基础设施创业如此艰难?

news2024/12/23 3:19:48

最近,Adept AI 宣布被亚马逊收购,这印证了 JOHN HWANG(前 AWS 生成式 AI 架构师,摩根士丹利交易主管)对未来的判断。于是他写了这篇文章,表达了对 AI 基础设施这个领域创业的隐忧。认为“AI 基础设施创业公司是一个陷阱式(tarpit idea)的想法”,尤指那些“风险投资阶段”的企业。Tarpit idea 是指那些表面上看起来合理,但在现实或严谨的思考中无法成立的创业想法。
他认为大多数 AI 基础设施创业公司会落入这个类别,如 RAG 服务、微调基础设施、文本处理服务、TTS API、向量数据库等。他相信许多人同意他的观点, 细数一下,Adept(被亚马逊收购)、Rockset(被 OpenAI 收购)、InflectionAI(被微软收购)纷纷被收购,Stability(如果后续被收购)、CharacterAI 等企业即将被收购,每个巨头都在通过并购讲述一个“端到端的 AI 平台”的故事,但只有少数幸运儿会被收购。

缺乏显著的差异化,只有巨头能活下去

为什么创业公司销售 AI 基础设施是一个陷阱式的创业想法呢?表面上看,在 AI 创业公司和企业构建 Gen AI 功能的繁荣景象中,出售工具和设备是完全合理的。毕竟,每月有超过 30,000 个“.ai”域名注册。

简而言之,新兴的 AI 基础设施创业公司将难以成功,因为它们缺乏显著的差异化和资本来攻占企业市场。这不是创业公司的错,真正的问题在于竞争动态。共同竞争的公司太多太多,而他们都能在 1-3 个月内提供相同的基础功能,这创造了一种集体陷阱动态,但只有巨头能够继续存活下去。这样说是因为:

为了使 AI 基础设施创业公司获得风险投资,它们最终需要赢得企业客户。这毫无疑问。而这一目标要求创业公司具备某种可持续的优势,使其产品与巨头(如 GCP、AWS 以及 Vercel、Databricks、Datadog 等)的产品区分开来。

不幸的是,大多数前沿创新要么来自巨头,要么来自研究院/开源社区,而巨头将创新商业化的能力更强,因为相较于创业公司,行业巨头拥有更多使用数据和客户关系。

更雪上加霜的是,来自创业公司的好点子都会很快被基准测试和复制。Databricks 和 Datadog 迅速赶上了初创公司中 LLMOps 领先产品(如 Arize AI)。

此外,开源社区也会开发其他 AI 基础设施创业公司产品的开源版本——这或许用来证明编写软件变得多么容易。

因此,创业公司难以长时间地维持相较于巨头的领先地位,并争取时间赢得商业合同。

企业客户也有“推迟”接纳新的 AI 基础设施供应商的理由,因为 AI 领域每隔几个月就会发生变化,供应商提供的产品的价值也会因此迅速下降。

基本上,AI 基础设施领域变成了一场利好长跑玩家的磨炼。

其他导致陷阱式创业的因素

还有三股主要力量在加剧竞争环境的恶化:

  1. 软件构件者现在习惯了用户“要求”的可组合性,即可以轻松地将您的产品替换成其他产品。这一要求对应用层的公司很友好,但对基础设施公司不利。开发者可以用 Llamaindex 替换 Langchain,通过 AWS Bedrock 用 Claude 3.5 替换 OpenAI 模型等等。每一层 LLM 训练和推理堆栈都有至少 10 种以上可行的解决方案,很难产生任何类型的锁定。

  2. 推理成本的持续下降也起到了作用。COGS(销货成本)快速下降,因此 AI 基础设施玩家需要不断地与拥有最大规模经济的巨头们进行价格匹配。消费群体几乎感知不到不同模型或代码的差异,因而转向了成本最低的供应商(巨头)。

  3. 巨头们似乎都有相同的、创建“端到端 AI 平台”的业务策略。Databricks 正在进入 AI 模型训练和商业智能领域,与 AWS Sagemaker 和 Tableau 竞争。GitHub Workspaces 正在进入 AI 驱动的安全评审等领域。

    a. 每个巨头的默认产品策略都是拥有其核心产品上下游的所有工作负载,这无意中使创业公司的存活更加艰难,因为创业公司很难用单点解决方案与巨头竞争。

转向垂直软件或应用层也不是灵丹妙药

面对这些挑战,一些 AI 基础设施创业公司选择转向垂直领域或移至应用层。例如,我从 2022 年底开始观察一个“自然语言商业智能”创业公司,该公司已经三次转型,从:

一个通用的“数据智能”平台,转向“商业智能数据”平台,转向“金融数据智能”平台。

AI 基础设施宠儿 LlamaIndex 和 Langchain 在其企业级产品上也采取了这一业务聚焦路径。LlamaIndex 专注于托管文档解析/OCR,而 Langchain 专注于 LLMOps 和代理构建解决方案。我猜两者都在进一步缩小其关注范围,因为即使销售托管文档解析服务对于种子阶段的创业公司来说也是一个巨大的范围,考虑到谷歌和 AWS 已经有现成的垂直文本提取服务,这些业务聚焦的尝试也并不容易。更重要的是,转向垂直领域低估了渊博的领域专业知识的重要性,而许多 AI 基础设施创始人缺乏这种专业知识,积累领域知识也需要时间。此外,您的产品可能需要针对垂直领域的独特需求进行大量定制,这也意味着利润率较低。更不用说,这些应用层生态系统的竞争甚至更为激烈。例如,风投的法律科技生态系统地图中早已没有放置新公司 logo 的空间。不仅有来自其他 AI 创业公司的竞争,还有来自传统软件公司的竞争。转向垂直领域并不会突然摆脱竞争对手——您有的只是新的竞争对手,这些竞争对手在您转型之前就已经在那里了。例如,法律科技行业已经存在很久了,许多法律 AI 公司现在正在与传统法律科技提供商以及系统集成商竞争。

对AI基础设施创业公司的建议

那么 AI 基础设施创业公司的解决方案是什么?我们是否都应该期望被大公司收购,还是创业公司也可以更长时间保持独立并找到产品市场契合点?
我的答案有些破坏氛围,但创业公司的解决方案还是回到基础:仔细思考如何形成与巨头的差异。

  1. 进一步缩小范围:专注于一个非常小的企业客户群,而不是服务所有客户。不要集成所有服务。比如,成为在本地 VMWare 使用 Salesforce 客户的托管 RAG 服务,而不是通用的 RAG 服务。创业公司没有资源解决所有环境的问题,至少在最初阶段没有这样的资源。
  2. 只专注于一个工作负载:创业公司不应该尝试解决太多的工作负载。把一件事做到极致。不要试图成为可以微调任何 LLM 的平台——市面上已经有太多这样的平台了。相反,比如尝试成为微调 Tagalog 模型的最佳平台。但问题是:TAM 可能太小。
  3. 筹集比您认为所需要的更多的风投资金:长跑是毋庸置疑的。企业客户接受购买创业公司 AI 基础设施解决方案可能也需要时间,不过前提是有企业愿意购买。要为最坏的情况做好准备。
  4. 或者,根本不筹集任何风投资金:筹集风投资金会迫使您围绕着如何向企业销售产品来制定业务战略——这可能不是您能做或想做的事情。因为 AI 领域不断发生变化,您会希望在出现更有趣、有前景的问题时,有灵活性去解决这些问题。

最后,AI 创业公司应该对被大公司收购保持开放态度,即使不是被像 OpenAI 或谷歌这样的知名企业收购也可以。我认为,AI 基础设施领域的并购市场将变得更糟而不是更好。因为随着输赢定局,需求明确,并购市场也会更加高效。要以“有吸引力”的估值出售您的创业公司,不要等到18个月之后所有AI基础设施创业公司都走到生命尽头时再出售您的公司

原文链接:https://nextword.substack.com/p/why-ai-infrastructure-startups-are

End

KubeBlocks 已发布 v0.9.0!KubeBlocks v0.9.0 全面升级了 API,构建一个 Cluster 更像是在用 Component “搭积木”!新增 topologies 字段,支持多种部署形态。InstanceSet 代替了 StatefulSet 来管理 Pods,支持将指定的 Pod 下线、Pod 原地更新,同时也支持数据库主从架构里主库和从库采用不同的 Pod spec。v0.9.0 还新增了 Reids 集群模式(分片模式),系统的容量、性能以及可用性显著提升!还支持了 MySQL 主备,资源的要求更少,数据复制的开销也更小!快来试试看!

小猿姐诚邀各位体验 KubeBlocks,也欢迎您成为产品的使用者和项目的贡献者。跟我们一起构建云原生数据基础设施吧!

💻 官网: www.kubeblocks.io

🌟 GitHub: https://github.com/apecloud/kubeblocks

🚀 Get started: https://cn.kubeblocks.io/docs/preview/user-docs/try-out-on-playground/try-kubeblocks-on-local-host

关注小猿姐,一起学习更多云原生技术干货。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1940831.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

有观点认为NVIDIA中国特供GPU H20也将面临禁售

为了能将GPU卖给中国市场,NVIDIA一直在魔改各种特供版,但是每每遭遇美国政府加码,随时都会被再次禁售,H20又要面临同样的命运。NVIDIA H20只配备了78组SM单元,相当于H100 SXM版本的六成、PCIe 5.0版本的接近七成&#…

在qt的c++程序嵌入一个qml窗口

//拖拽一个QQuickWidget c端和qml通信的桥梁 找到qml的main.qml的路径 ui->quickWidget->setSource(QUrl::fromLocalFile("../../../code/main.qml"));// QML 与 Qt Widgets 通信//窗口就成了一个类实例对象pRoot (QObject*)ui->quickWidget->rootObje…

centos8 一键安装nginx指定版本

centos 8 的源里面已经有nginx,支持命令直接安装 dnf install nginx -y但默认安装 1.14 版本,版本较老,存在安全问题。在官网找到指定版本rpm包,可直接安装 http://nginx.org/packages/centos/8/x86_64/RPMS/这里选择1.18&#…

python—爬虫爬取视频样例

下面是一个使用Python爬虫爬取视频的基本例子。创建一个Python爬虫来爬取视频通常涉及到几个步骤:发送HTTP请求、解析网页内容、提取视频链接、下载视频文件。 import jsonimport requests from lxml import etreeif __name__ __main__:# UA伪装head {"User…

一款国外开发的高质量WordPress下载站模板主题

5play下载站是由国外站长开发的一款WordPress主题,主题简约大方,为v1.8版本, 该主题模板中包含了上千个应用,登录后台以后只需要简单的三个步骤就可以轻松发布apk文章, 我们只需要在WordPress后台中导入该主题就可以…

《简历宝典》17 - 简历中“技术能力”,如何丰满且有层次,前端篇

这一节开始对技术能力模块做讲解,我们身边的这些互联网IT从业者们,前端开发、Java开发、软件测试又或者是其他职位的开发者们,技术能力这个模块是绕不过去的,从简历上看,这个模块体现了我们之前软件工作生涯中的技术功…

二、C#数据类型

本文是网页版《C# 12.0 本质论》第二章解读。欲完整跟踪本系列文章,请关注并订阅我的Essential C# 12.0解读专栏。 前言 数据类型(Data Type)是一个很恼人的话题。 似乎根本没必要对数据类型进行展开讲解,因为人人都懂。 但是…

Ubuntu 24.04 LTS Noble安装Docker Desktop简单教程

Docker 为用户提供了在 Ubuntu Linux 上快速创建虚拟容器的能力。但是,那些不想使用命令行管理容器的人可以在 Ubuntu 24.04 LTS 上安装 Docker Desktop GUI,本教程将提供用于设置 Docker 图形用户界面的命令…… Docker Desktop 是一个易于使用的集成容…

IVI(In-Vehicle Infotainment,智能座舱的信息娱乐系统)

IVI能够实现包括三维导航、实时路况、辅助驾驶等在线娱乐功能。 IVI人机交互形式(三板斧):声音、图像、文字 IVI人机交互媒介I(四件套):中控屏幕(显示、触控)、仪表显示、语言、方…

Python爬虫(2) --爬取网页页面

文章目录 爬虫URL发送请求UA伪装requests 获取想要的数据打开网页 总结完整代码 爬虫 Python 爬虫是一种自动化工具,用于从互联网上抓取网页数据并提取有用的信息。Python 因其简洁的语法和丰富的库支持(如 requests、BeautifulSoup、Scrapy 等&#xf…

规范:前后端接口规范

1、前言 随着互联网的高速发展,前端页面的展示、交互体验越来越灵活、炫丽,响应体验也要求越来越高,后端服务的高并发、高可用、高性能、高扩展等特性的要求也愈加苛刻,从而导致前后端研发各自专注于自己擅长的领域深耕细作。 然…

SpringCloud极限速通版

1.SpringCloud概述 1.1 什么是微服务 1.1.1 单体架构 业务所有功能都打包在一个war包或jar包,这种方式就是单体架构,单体架构的应用就是单体应用。这种架构开发简单,部署简单,一个项目包含所有功能;省去了多个项目之…

图片上传成功却无法显示:静态资源路径配置问题解析

1、故事的背景 最近,有个学弟做了一个简单的后台管理页面。于是他开始巴拉巴拉撘框架,写代码,一顿操作猛如虎,终于将一个简单的壳子搭建完毕。但是在实现功能:点击头像弹出上传图片进行头像替换的时候,卡壳…

力扣高频SQL 50 题(基础版)第一题

文章目录 力扣高频SQL 50 题(基础版)第一题1757.可回收且低脂的产品题目说明思路分析实现过程准备数据:实现方式:结果截图: 力扣高频SQL 50 题(基础版)第一题 1757.可回收且低脂的产品 题目说…

昇思25天学习打卡营第14天 | SSD目标检测

探索SSD目标检测算法 在深入学习SSD(Single Shot MultiBox Detector)目标检测算法的过程中,我对现代计算机视觉中的目标检测技术有了更加深入的理解。SSD作为一种有效的单阶段目标检测算法,它在准确性和检测速度之间取得了良好的…

HAL库源码移植与使用之RTC时钟

实时时钟(Real Time Clock,RTC),本质是一个计数器,计数频率常为秒,专门用来记录时间。 普通定时器无法掉电运行!但RTC可由VBAT备用电源供电,断电不断时 这里讲F1系列的RTC 可以产生三个中断信号&#xff…

分类损失函数 (一) torch.nn.CrossEntropyLoss()

1、交叉熵 是一种用于衡量两个概率分布之间的距离或相似性的度量方法。机器学习中,交叉熵常用于损失函数,用于评估模型的预测结果和实际标签的差异。公式: y:真是标签的概率分布,y:模型预测的概率分布 …

FPGA实验3:D触发器设计

一、实验目的及要求 熟悉Quartus II 的 VHDL 文本设计简单时序电路的方法; 掌握时序电路的描述方法、波形仿真和测试,特别是时钟信号的特性。 二、实验原理 运用Quartus II 集成环境下的VHDL文本设计方法设计简单时序电路——D触发器,依据…

【Godot4.2】GodotXML插件 - 解析和生成XML

概述 近期在研究基于Godot的XML和SVG解析,并且在昨天(2024年7月20日)编写了一个简易的SVG文件解析器。 在群友的提示下,知道早就存在GodotXML这样的解析器。所以今天就来测试使用并准备研究学习源代码了。和以往一样&#xff0c…

康康近期的慢SQL(oracle vs 达梦)

近期执行的sql,哪些比较慢? 或者健康检查时搂一眼状态 oracle: --最近3天内的慢sql set lines 200 pages 100 col txt for a65 col sql_id for a13 select a.sql_id,a.cnt,a.pctload,b.sql_text txt from (select * from (select sql_id,co…