前言
自去年引发“百模大战”,到近日开启“行业价格战”,中国大模型行业迈入了新的发展阶段。在近期的智源大会上,众多专家分享了对大模型发展现状的见解。结合 IDC 近期发布的大模型实测报告以及 Scale AI 的“AI 就绪报告”,大模型在应用方面的机会与面临的挑战逐渐明晰。
大模型赚钱的“攻略”是否已经明晰?
解读要点
-
对于大模型的应用场景、价格战、开源等方面,专家们对产业现状有着怎样的看法?
-
李开复所提及的 ToC 市场的机会具体在何处?当前的情况又如何?
-
ToB 市场中的大模型公司若要盈利需处理好哪些问题?
-
Transformer 七子之一所创立的 Cohere 是怎样通过差异化走向 ToB 盈利的?
-
开源为何不会削弱初创公司的竞争力?它是否真能打破大公司的垄断优势?
大模型的应用场景、价格战、开源……CEO 们对产业现状的看法
-
在一场炉边对谈中,零一万物 CEO 李开复与清华之能产业研究院院长张亚勤围绕大模型产业化的应用场景以及在 toB 和 toC 领域的机会分别阐述了各自的观点:
- 李开复认为,在短期内,大模型在中国 ToC 市场拥有更多机会,而在国外,ToB 和 ToC 市场均有机会。大模型在 ToB 市场可能创造更大价值,且实现速度可能快于 ToC 市场,但目前仍面临一些挑战。
- 张亚勤表示,在应用和服务层面,大模型将先面向消费者(To C),再面向企业(To B)。To B 的发展周期相对较长,而 To C 的应用产品能够快速推出,这与过去 PC 互联网和移动互联网的发展路径基本相符。
-
在一场主题对话中,针对此前大模型公司价格战的现象,月之暗面、百川智能、智谱 AI、面壁智能四家公司的 CEO 各自发表了看法。虽然他们的观点各有侧重,但总体都持积极态度:
- 月之暗面 CEO 杨植麟对价格战提出了三点判断。从算力投入角度看,在某个时间点,推理所需算力将超过训练算力,从而覆盖训练成本;从 C 端来看,推理成本可能低于获客成本,这可能会改变传统商业模式;此外,尽管 AI 在工作流程中所占比例可能较低,但随着时间推移,AI 的价值可能超过人类,从而改变商业模式和投资回报率(ROI)问题。
- 百川智能 CEO 王小川认为价格战对中国大模型的发展极为有利。价格战有助于大模型的推广与普及,使更多公司和个人能够使用大模型,同时促使企业回归自身优势,明确自身定位。
- 智谱 AI CEO 张鹏认为,从宏观层面来看,通过低价让更多人使用大模型对产业有益,但在商业上,牺牲企业短期成本并非正常逻辑,必须回归用户价值和生产力价值。
- 面壁智能 CEO 李大海认为,当前的价格战具有一定的营销成分,但未来大模型的价格必然会更加亲民,同时确保所有参与者都能盈利才是健康的发展模式。
-
在智源大会上,“LSTM 之父”Jürgen Schmidhuber 和王小川从不同角度分享了对开源的看法:
- Schmidhuber 表示开源运动至关重要,随着硬件成本的降低和性能的提升,开源将使更多年轻一代有机会接触和改进优秀算法,从而使部分大公司笼络顶尖 AI 人才的做法难以长期维持。
- 王小川也对开源持积极态度,他认为开源能够使中国的模型生态追赶美国,对于百川来说,在技术快速进步的当下,开源既有助于做出贡献,又不会降低自身竞争力。
李开复所说的 ToC 市场的机会具体在哪里?目前的情况如何?
李开复认为中国 ToC 市场在短期内机会更多,而国外在 ToB 和 ToC 市场均有机会。在此基础上,从 IDC 近日发布的《中国大模型市场主流产品评估,2024》报告、“AI 产品榜”近期数据以及 A16Z 在 3 月发布的 GenAI Top100 报告来看,ToC 市场的 AI 应用热度目前主要集中在生产力和娱乐类场景,AI 搜索也开始崭露头角。
-
对于 ToC 市场,李开复指出 AI 2.0 时代将按照与 PC、移动互联网相似的节奏发展,应用重心将依次经历生产力→娱乐/音乐/游戏→搜索→电商→社交/短视频/O2O 的递进过程:
- 他表示,在应用初期,要能够盈利并解决问题,因此第一波潮流将是生产力工具。但越往后发展,难度越大。高用户量的应用商业模式通常是先积累用户,再寻找变现模式,所以应用成本必须很低,试错难度较大,所需投资也更多。
- 由于目前大模型的推广成本仍然较高,因此在考虑产品市场契合度(PMF)时,还需将技术需求、实现难度和成本考虑在内,即形成技术成本×产品市场契合度(TC - PMF)。
- 李开复表示他不相信技术能够永远领先,因此大模型公司一旦验证了 TC - PMF,就需要抓住时间窗口打造持续优势,例如品牌优势、社交链、用户数据等,以防止用户流失。
-
根据“AI 产品榜”的 AI 应用访问量增速统计,中国 ToC 市场目前正处于第一波潮流,即使用提高生产力的 AI 工具,其次是基于生成式 AI 的图像或视频编辑工具,AI 搜索也具有一定热度:
- 根据“AI 产品榜”的国内高增速排名,在 5 月访问量超过 30 万的 40 款国产 AI 工具中,大部分属于生产力工具,包括开发者工具、文字转音频、设计工具、思维导图、写作工具等。
- AI 搜索类应用数量不多,但近期访问量增长迅速。360AI 搜索、昆仑万维天工 AI 搜索、秘塔 AI 搜索的访问量增速在 4 月位居前 4 位,虽然在 5 月增速有所放缓,但仍处于增速榜前 20 名。
-
IDC 团队从基础能力到应用能力等 7 个维度对 11 家大模型厂商的 16 款市场主流产品进行了实测,并评选出了各维度的优势厂商。这些优势模型面向 ToC 应用场景主要集中在“办公用具”和“生活助手”两类:
- 该测试的题目分为基础能力和应用能力两大类,共 7 个维度。基础能力包括问答理解类、推理类、创作表达类、数学类、代码类;应用能力主要包含 ToC 通用场景类和 ToB 特定行业类。
- 从模型基础能力来看,当前大模型在 ToC 通用场景类的得分率较高,而在数学类、推理类、代码类问题以及行业应用类的准确率较低。
- IDC 表示大模型厂商需要巩固产品在优势领域的应用,如问答理解、ToC 通用场景;对于刚刚开始投入大模型技术研发的供应商,可以考虑从这些成熟度较高的场景入手进行尝试。
-
对于海外 ToC 市场,A16Z 此前发布的 GenAI Top100 报告指出,生产力和娱乐类的 AI 应用越来越受到用户欢迎:
- 该报告统计了 2023 年 9 月至 2024 年 3 月期间生成式 AI 应用的热度,音乐类和生产力工具(包括研究、编码协助和文档摘要等任务)类是新上榜的两大类应用。
- 生产力工具类应用包括 Liner、Eightify、Phind、MaxAI、Blackbox AI 等,它们利用 AI 编辑和摘要等功能,帮助员工、自由职业者和中小企业主更高效地完成工作。
- 音乐类是指此前爆火的文生音乐应用“Suno”。
-
然而,ToC 市场的热度并非一帆风顺。2024 年 3 月的“全球 AI 产品降速榜”似乎对部分全球 ToC 市场的需求进行了“证伪”:
- “全球 AI 产品降速榜”统计了 2 月访问量在 100 万以上降速前 30 名的 AI 应用。其中,AI 图像生成器类应用在 Top 50 中的数量最多,占比为 10%。其次是 AI 聊天机器人和 AI 视频生成器类应用,各占 6%。
ToB 市场的大模型公司要想盈利需处理好哪些问题?
对于 ToB 市场,李开复指出大模型可能带来更大的价值,且实现速度可能快于 ToC 市场。然而,ToB 领域存在的挑战在于,大公司大多对颠覆性技术的采用持谨慎态度,而且许多(尤其是中国)大公司对软件价值的认识不足,付费意识有待提高。此前,Scale AI 在“AI 就绪报告”中收集并分析了大量 AI 从业者的真实意见,总结了企业对大模型和生成式 AI 的采用意向和顾虑。
-
Scale AI 基于 1800 份问卷发现,在 2023 - 2024 年间,越来越多的企业开始计划使用生成式 AI,主要用于提高生产力和改善客户体验:
- 认真考虑使用生成式 AI 的企业比例从 12%上升至 18%,无计划使用的比例从 19%降至 4%。
- 认为 AI 在未来三年对其业务非常关键或高度关键的企业比例从 69%上升至 74%,在生产中使用生成式 AI 的组织比例从 21%上升至 38%。
- 大多数企业倾向于使用生成式 AI 来提高运营效率。问卷显示,62%的企业将提高运营效率作为采用生成式人工智能的主要驱动力,59%的企业选择用 AI 改善客户体验。
-
安全问题固然重要,但企业不采用大模型的主要原因在于其不够好用:
- Scale AI 的报告指出,在所在企业尚未采用 AI 工具的受访者中,60%表示模型安全问题和缺乏专业知识是阻碍他们的两大主要原因。这一发现在一定程度上验证了当前新闻中有关“人工智能安全”的报道和顾虑。
- 对于已经采用大模型的企业受访者,61%表示基础设施、工具或开箱即用的解决方案无法满足他们的特定需求。
- 在 AI 从业者对模型能力的评估中,首要考虑的是模型的性能和可靠性(各占 69%),而优先考虑安全性的比例相对较低。
大模型资源分享
针对所有自学遇到困难的同学,我为大家系统梳理了大模型学习的脉络,并且分享这份LLM大模型资料:其中包括LLM大模型书籍、640套大模型行业报告、LLM大模型学习视频、LLM大模型学习路线、开源大模型学习教程等。😝有需要的小伙伴,可以扫描下方二维码免费领取↓↓↓
一、全套 AGI 大模型学习路线
AI 大模型时代的精彩学习之旅:从根基铸就到前沿探索,牢牢掌握人工智能核心技能!
二、640 套 AI 大模型报告合集
此套涵盖 640 份报告的精彩合集,全面涉及 AI 大模型的理论研究、技术实现以及行业应用等诸多方面。无论你是科研工作者、工程师,还是对 AI 大模型满怀热忱的爱好者,这套报告合集都将为你呈上宝贵的信息与深刻的启示。
三、AI 大模型经典 PDF 书籍
伴随人工智能技术的迅猛发展,AI 大模型已然成为当今科技领域的一大热点。这些大型预训练模型,诸如 GPT-3、BERT、XLNet 等,凭借其强大的语言理解与生成能力,正在重塑我们对人工智能的认知。而以下这些 PDF 书籍无疑是极为出色的学习资源。
阶段 1:AI 大模型时代的基础认知
-
目标:深入洞悉 AI 大模型的基本概念、发展历程以及核心原理。
-
内容
:
- L1.1 人工智能概述与大模型起源探寻。
- L1.2 大模型与通用人工智能的紧密关联。
- L1.3 GPT 模型的辉煌发展历程。
- L1.4 模型工程解析。
- L1.4.1 知识大模型阐释。
- L1.4.2 生产大模型剖析。
- L1.4.3 模型工程方法论阐述。
- L1.4.4 模型工程实践展示。
- L1.5 GPT 应用案例分享。
阶段 2:AI 大模型 API 应用开发工程
-
目标:熟练掌握 AI 大模型 API 的运用与开发,以及相关编程技能。
-
内容
:- L2.1 API 接口详解。
- L2.1.1 OpenAI API 接口解读。
- L2.1.2 Python 接口接入指南。
- L2.1.3 BOT 工具类框架介绍。
- L2.1.4 代码示例呈现。
- L2.2 Prompt 框架阐释。
- L2.2.1 何为 Prompt。
- L2.2.2 Prompt 框架应用现状分析。
- L2.2.3 基于 GPTAS 的 Prompt 框架剖析。
- L2.2.4 Prompt 框架与 Thought 的关联探讨。
- L2.2.5 Prompt 框架与提示词的深入解读。
- L2.3 流水线工程阐述。
- L2.3.1 流水线工程的概念解析。
- L2.3.2 流水线工程的优势展现。
- L2.3.3 流水线工程的应用场景探索。
- L2.4 总结与展望。
阶段 3:AI 大模型应用架构实践
-
目标:深刻理解 AI 大模型的应用架构,并能够实现私有化部署。
-
内容
:- L3.1 Agent 模型框架解读。
- L3.1.1 Agent 模型框架的设计理念阐述。
- L3.1.2 Agent 模型框架的核心组件剖析。
- L3.1.3 Agent 模型框架的实现细节展示。
- L3.2 MetaGPT 详解。
- L3.2.1 MetaGPT 的基本概念阐释。
- L3.2.2 MetaGPT 的工作原理剖析。
- L3.2.3 MetaGPT 的应用场景探讨。
- L3.3 ChatGLM 解析。
- L3.3.1 ChatGLM 的特色呈现。
- L3.3.2 ChatGLM 的开发环境介绍。
- L3.3.3 ChatGLM 的使用示例展示。
- L3.4 LLAMA 阐释。
- L3.4.1 LLAMA 的特点剖析。
- L3.4.2 LLAMA 的开发环境说明。
- L3.4.3 LLAMA 的使用示例呈现。
- L3.5 其他大模型介绍。
阶段 4:AI 大模型私有化部署
-
目标:熟练掌握多种 AI 大模型的私有化部署,包括多模态和特定领域模型。
-
内容
:- L4.1 模型私有化部署概述。
- L4.2 模型私有化部署的关键技术解析。
- L4.3 模型私有化部署的实施步骤详解。
- L4.4 模型私有化部署的应用场景探讨。
学习计划:
- 阶段 1:历时 1 至 2 个月,构建起 AI 大模型的基础知识体系。
- 阶段 2:花费 2 至 3 个月,专注于提升 API 应用开发能力。
- 阶段 3:用 3 至 4 个月,深入实践 AI 大模型的应用架构与私有化部署。
- 阶段 4:历经 4 至 5 个月,专注于高级模型的应用与部署。