今年的大模型赛道,看不见硝烟,却是一个白热化的战场。
这背后是对更大场景、更大规模用户入口和先发优势的争夺。在AGI尚未到来的当下,行业有一个共识:真实场景中的大规模应用,是大模型价值验证和通往AGI的必由之路。
找到高频、刚需场景,实现规模应用,完成模型能力迭代和业务运转的闭环,成了这一阶段的竞争重点。
那么,场景从哪里来呢?
就在今天,钉钉在自己的生态大会上,宣布对所有大模型厂商开放。这是一个有着7亿用户和数千万企业级组织的平台,土壤不可谓不肥沃。此前,在此播种耕耘的是和钉钉同属阿里的通义大模型;而现在,MiniMax、月之暗面、智谱AI、猎户星空、零一万物、百川智能这六家大模型厂商,带着自己的“锤子”,找到了钉钉。
这是一场双向的奔赴。大模型厂商们更多样化的模型底座能力,满足了钉钉上企业和用户更多元的智能化需求。而模型厂商们进入高频刚需的企业办公入口,期望基于千行百业场景的汪洋大海,完成更快的模型迭代,并打捞出属于自己的用户和客户。
三场战争:入口、项目,和人
ToB还是ToC,这是一个问题。
大模型厂商们基于自身的视角,目前ToB和ToC选择并不相同。但年初到现在,一众厂商已经在ToC的AI应用、ToB的项目争夺、开发者人群的影响力这三个战场展开了激烈竞争。
争抢C端用户心智的战场,主要是发生在应用商店和各大主流内容平台上。
年初开始,一些内容平台上就已经出现了大模型应用广告战开打的端倪。最热的时候,在B站首页上看到大模型应用的原生广告能达到了6条之多。小红书也是AI应用厂商们热战的前线,博主推荐AI陪伴类应用和生产效率助手时,每个APP都能列出一份很长的智能体清单。线下,在机场和地铁站里,大模型厂商打出的广告牌也占据了醒目位置。争抢C端注意力,各家可谓备足了弹药。
关乎真金白银的B端项目角逐,也是市场关注热点。今年以来大模型相关的项目迎来爆发,招投标信息是市场风向标。
此前数智前线有过统计,今年上半年以来,项目数量逐月增加,运营商、金融、教育、能源、政务、汽车等多个行业涌现出了大量项目。招投标统计里能看到亿元大单,也出现了零元中标的项目。各家企业拿单的数量座次,几乎每个月都要重排一次。
上个月的降价潮,更是突如其来。从大模型创业公司到云厂商到老牌人工智能企业都加入了战场。一些人评价它可能会摧毁一些公司此前建立的商业设计和安排,也有人认为,推理成本下降而来的降价,能使得更多应用开发者用上大模型,行业喜闻乐见。无论动因是增加曝光度,争抢用户,还是防止用户流失,争抢开发者人群里的影响力和份额,成了厂商们打出的明牌。
有行业人士认为,大模型领域开启的一个又一个的战局,可能意味着行业可能正走向一个分岔口。
清华大学新闻学院元宇宙文化实验室主任沈阳就认为,价格战当下发生,说明各个大模型的功能和性能在快速接近,模仿GPT-4的阶段已基本告一段落,AI已从创新试验走向了大众推广阶段。随着规模急速扩张的阶段到来,市场份额成为首要关注。“如果在这个阶段落伍的话,功能好(也)没有用了。”
创投界人士朱啸虎近期在一个创投论坛演讲环节指出,从GPT-3到GPT-4,从GPT-4发布到现在已经有15个月了。打价格战是因为大家都在一条起跑线上,性能上基本没有差异,所以最终只能拼价格,这话有点残酷,但可能已经贴近行业现实。
**实际上,今年以来,与AI相关的发布异常密集。**有人统计,自2月Sora横空出世以来,AI相关的发布进入了史上最密集时期。围绕着模型能力的热点也时刻滚动,长文本、知识库、MOE、多模态、端到端等不一而足。IDC观察到,国内市场从今年第二季度开始,越来越多的AI技术供应商开始更新升级基础大模型及相关产品,新一轮的“百模大战”一触即发。
但业界也发现,一旦一家厂商刷新了某个指标,其他家则会快速跟进。甲子光年在一份报告里称之为“ME TOO ”竞争,你一旦有,我也马上会有。各类Benchmark中,国内最强大模型的座次轮番变换已是常态。
这一背景下,围绕着应用、落地和占据更大用户群体的竞争,变得不可避免。
拥抱场景,拥抱用户,已成行业共识
业界经常用iPhone刚问世的2007年来类比当下,“在iPhone刚出现的时候,我们很难想得到今天移动端会出现抖音这样的产品。但没有前面这么多年的发展积累,今天这些爆款应用不可能凭空出现”,一位大模型企业的高管认为,一切才刚刚开始。
在市场发展早期,模型、产品和模式可能都不是最终形态,厂商们需要摸索大模型的能力边界,形成PMF,从而构建自己的商业模式。在这个过程里,基于不同的生态站位,不同的厂商就正在走向市场策略和偏向的不同分野。
比如一些厂商选择ToB、ToC两条腿走路,既做了面向大众市场的产品进应用商店,也面向行业市场去服务不同企业客户,做ToB的生意,这也是行业内多数玩家包括OpenAI在内都采取的策略。也有企业当下坚定ToB,认为目前阶段需要围绕现实的需求与实际的场景去结合,越快抢客户和数据,形成应用先发优势;当然也还有一些坚定认为AGI的通用能力,可以解锁ToB、ToC不同场景的玩家。
**这些分野下,你很难看到处于不同分野的角色形成一个统一的认知,并且去形成整齐划一的行动。**比如AI广告战、ToB抢订单和降价浪潮里,企业的角色和参与力度就各不相同。
但行业内也依然有共识。拥抱更大场景,拥抱更大规模的用户群体,实现在真实场景中的大规模应用,是大模型价值验证和通往AGI的必由之路。
某种程度而言,今年大模型市场爆发的三场战争,也是大模型厂商们在争夺大规模应用的入口和先发优势。
月之暗面杨植麟把拥抱更大规模用户群体称为“User Scaling”,它与基础的模型层的“Model Scaling”同等重要。“只有面向海量用户的模式才能实现快速的反馈循环,使组织能够形成一种快速迭代的文化,从而以天为单位更新模型,满足用户需求,以数据为核心,实现快速的业务运转。”杨植麟说。
AGI的积极推动者,OpenA的创始人 Sam Altman上个月出席微软的Microsoft Build Event时也坦言,“通用人工智能这样的新技术,并不能让你摆脱建立一个伟大的产品、公司或者服务的艰苦工作,AI不会自动打破商业规则。”他给创业者提了两条建议,一是要加入浪潮,不要观望,第二是创业者必须弄清楚如何建立持久的价值。
而拥抱场景,对大模型ToB的重要性也不言而喻。这是一个模型能力和行业需求匹配的过程,一位做模型落地的企业董事长提过,大模型落地要讲究三个实——针对场景落地的工程化实战交付;是否实用,模型的能力能否与用户的业务需求对上;能否产生实效,真正带来降本增效。
“大模型落地不是解决最后一公里问题,而是最后100公里,因为它有很长的距离,你有一个好模型,并不一定能得到一个好的业务价值。”智谱AI COO 张帆说,因此他们除了有完整的模型矩阵和完整的模型运营的MaaS平台,还有扎到场景里去的能够帮助客户梳理业务的本地化团队。只有深入场景,才能完成从交付模型价值,到交付应用价值乃至交付业务价值的转变。
**过去一年,不同的厂商们也做了大量的场景拓展和探索。**比如在C端应用里,AI搜索、知识管理、学习助手类的生产效率类智能体占据了各应用中智能体市场的热门位置。
而在行业市场,沙丘智库最近做了基于106个行业落地案例做了统计发现,大模型落地覆盖了19个用例方向,其中知识助手(18.9%)、智能客服(15.1%)、编码助手(12.3%)是率先产生价值的场景。
无论是大众应用,还是企业级市场,围绕着知识管理、编码助手、数据分析、文档助手等生产效率相关领域正成为AI应用落地的高频场景。
最近苹果发布会宣布AI动向时,英伟达高级研究科学家Jim Fan在X平台评论:“谁先赢得苹果,谁就赢得了胜利。”他非常看重这个超级生态的价值。
而当下在国内的大模型应用战里也是同样,谁能更快拥抱大场景和更大规模人群,加速在高频场景里实现实现能力迭代和业务运转的闭环,可能占据了更优势的位置。
双向的奔赴
对大模型厂商而言,钉钉此次的开放,给它们打开了进入更大场景和用户人群的大门。
钉钉此次面向大模型公司开放的场域分三类。一是结合各大模型的特点,与大模型厂商共同探索相应能力在钉钉自身产品中的场景应用。第二,在钉钉的AI助理开发平台上,开发者在钉钉上创建AI助理(AI Agent)时,可以依据自身需求,选择不同厂商的大模型。第三,钉钉与大模型厂商一起,针对客户的具体需求,为客户定制相应的智能化解决方案,可实现私有化部署。
去年4月,钉钉接入通义大模型,用AI将产品重做了一遍,截止目前已完成了20多条产品线80多个功能的AI化。当时,还有一批行动迅速的企业基于钉钉接入的通义大模型的能力,与钉钉AI PaaS及Chat AI解决方案团队共创,打造了智能问答应用。比如在艾为电子和铁骑力士等企业利用大模型技术,解决传统客服问答场景里“命中”模式带来的智能程度不高等问题,实现了降本提效。
而作为国内最大的智能化协同办公和应用开发平台,随着更多行业用户和企业在钉钉上触达和接触到大模型和AI,来自这些行业和客户的更多样的智能化需求也浮出了水面。对钉钉而言,引入更多元的模型能力,能更好服务平台上广大企业客户和用户。
比如,月之暗面大模型的长文本理解和输出能力,天然与钉钉上需求最旺盛的工作信息总结、会议纪要和教育类的学习资料总结、教学辅助类场景吻合。
MiniMax在语音模型和多模态模型上的能力,能够智能预测文本的情绪、语调等信息,并生成自然、高保真、个性化的语音。这在钉钉考勤的设备上以及一些需要用语音与钉钉交互的工作场景,比如开车时或者工人在车间劳作时的场景,能碰撞出广阔的想象空间。
有一些大型的传统企业有一些定制化需求,他们可能对怎么用大模型并没有概念,需要有在地团队能做好从业务规划、培训到落地的全套服务,智谱AI这样的除了有多场景模型能力,还具有完整落地方法论的团队更能贴合他们的需求。
还有一些钉钉上企业重视私有化部署,有非常直观的成本要求和落地价值指标,如能节省多少,工作效率提升的数据等。这时候一些体量比较小,性能很好、成本可控的方案,比如基于猎户星空大模型为企业提供的私有化定制服务,就比较符合这个群体的需求。
猎户星空有“为企业应用而生”的私有化大模型,在企业知识问答、决策分析、云管理等场景有着丰富实战经验,可以帮助企业在AI时代抢跑。同时,猎户星空自研大模型机器人,在展厅、餐厅、直播店铺、超市、酒店五个核心应用场景,能够紧密结合企业需求。
傅盛指出,“千亿参数大模型虽然全面性更好,能做奥数题,回答法律知识,但是在企业场景当中并不需要做奥数题,只要在一个专业点做好就可以了。所以专业应用领域,用一个百亿参数把数据打磨好,把应用做好,就可以满足需求,而且更具性价比。”
而钉钉这个超过7亿用户规模,千万级企业客户的平台,在国内的企业协同办公市场,绝对算得上入口级的存在。大模型厂商们有机会进入这个巨大的用户池,就是在目前大模型应用的高频刚需场景上攻下了一角。
“钉钉拥有巨量的用户的生态,有无数的场景,而且这些场景和生态是天然结合在一起的”,在这个高频刚需场景里,模型厂商们期望实现模型的更快迭代。
MiniMax 闫俊杰认为,这是一次双赢的合作,从第一次接触钉钉到落地也就花了两个月。模型的通用能力还在肉眼可见的速度提升,错误率还有下降至少一个数量级的空间。这会导致AI的能力从部分的惊艳到稳定的靠谱转变,进一步提升AI的渗透率。钉钉上有最多的企业用户,特别是大量中小型的企业,相信AI通用能力的提升会极大促进企业效率的提升。
杨植麟指出,用户触点非常重要,钉钉天然拥有海量的用户以及生产力的心智,它们很重视在这个过程中,用户对产品的反馈。“我们相信AGI最终是一个和用户协作产生的东西。”
智谱张帆则提到,除了在产品层面接入模型,把模型的原生能力和钉钉结合,他们也很重视把Agent平台转化成真正的应用,不只是在钉钉产品场景,并且能够延伸到更多的财税、法务、CRM等细微场景的应用,给客户带来生产力的提升。
当然,这个肥沃的市场,并不是丢个种子就能种出来的。如何真正用好这个平台,对模型厂商们也有一些挑战。一方面,它们可能要真正形成差异化的能力,才能在具体的场景里从众多模型厂商中脱颖而出。
另外,大模型企业需要和平台一起,在各种三方的场景里做出标杆来,真正给企业带来大模型的价值,才能在这个场景里扎稳扎深,从海洋里打捞出自己的用户和客户。
如何学习大模型 AI ?
由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。
但是具体到个人,只能说是:
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
第一阶段(10天):初阶应用
该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。
- 大模型 AI 能干什么?
- 大模型是怎样获得「智能」的?
- 用好 AI 的核心心法
- 大模型应用业务架构
- 大模型应用技术架构
- 代码示例:向 GPT-3.5 灌入新知识
- 提示工程的意义和核心思想
- Prompt 典型构成
- 指令调优方法论
- 思维链和思维树
- Prompt 攻击和防范
- …
第二阶段(30天):高阶应用
该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。
- 为什么要做 RAG
- 搭建一个简单的 ChatPDF
- 检索的基础概念
- 什么是向量表示(Embeddings)
- 向量数据库与向量检索
- 基于向量检索的 RAG
- 搭建 RAG 系统的扩展知识
- 混合检索与 RAG-Fusion 简介
- 向量模型本地部署
- …
第三阶段(30天):模型训练
恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。
到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?
- 为什么要做 RAG
- 什么是模型
- 什么是模型训练
- 求解器 & 损失函数简介
- 小实验2:手写一个简单的神经网络并训练它
- 什么是训练/预训练/微调/轻量化微调
- Transformer结构简介
- 轻量化微调
- 实验数据集的构建
- …
第四阶段(20天):商业闭环
对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。
- 硬件选型
- 带你了解全球大模型
- 使用国产大模型服务
- 搭建 OpenAI 代理
- 热身:基于阿里云 PAI 部署 Stable Diffusion
- 在本地计算机运行大模型
- 大模型的私有化部署
- 基于 vLLM 部署大模型
- 案例:如何优雅地在阿里云私有部署开源大模型
- 部署一套开源 LLM 项目
- 内容安全
- 互联网信息服务算法备案
- …
学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。
如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。