文丨亲爱的数据 谭婧
“GPT大模型到底能不能用?用在哪里?”
这是目前中国大型企业一把手最关心的问题之一。AI大模型也被媒体称为“一把手”工程。
大型企业会非常认真地考虑大模型的应用。最近个把月,大型企业客户对大模型的热烈反应让第四范式首席科学家陈雨强感到振奋。
他告诉我,客户中有不少声音提出:
“一家大型传统企业(金融,能源,交通)为了写一首诗、一篇文章、一段摘要或者生成一幅美图就投入研发大模型,这个成本对企业来说,就太高了。”
而面对大模型的企业级市场,客户需求到底是什么?
好奇和质疑同样充斥市场,大型企业正在审慎思考,如何用好“投入巨大费用高昂”大模型,本质还是科技如何给大型企业创造价值。
答案千般万种,而第四范式给出的答案是AIGS,指AI-Generated Software。
范式认为,AI大模型的核心用途在于帮助大型企业提升软件开发流程和效率,以及提升企业软件用户体验。
第四范式的大模型名叫“式说”,是基于多模态大模型底座的开发平台。
从2023年2月到4月,式说产品已完成三代迭代,聚焦于大模型重构企业软件。
到底如何重构,又重构哪里?
软件开发中,To C产品的功能相对比较聚焦,购物、打车、买菜等等;
而To B产品则颇为不同,企业级软件高度定制化,直接面对复杂和繁难问题。
功能和执行的不同逻辑,切十几层菜单不算多,堆成千上万个功能也不算多。此外,企业级软件往往会有很强的知识性,学科知识、业务知识、供应链知识等等。
当企业软件产品的复杂性成为另外一门学问,又会倒逼和影响企业软件开发与设计的思路,这是一种强耦合关系。
对企业软件使用者来说,出错机会多了,上手速度慢了,工作效率低了。
范式认为,这些难处恰恰为生成式AI技术及其发展留下足够的应用空间。这些苦活累活,终于由AI接管了。
帮我执行一个装箱任务
任务目标:
分析集装箱及小箱子尺寸,设计装箱方案
点击看大图
大家对生成式模型并不陌生了,它有很多特长:文字摘要,篇章总结,迅速画图,多轮对话,耐心解答。
然而,企业经营有目标,从成本角度考虑,一家企业拥有的大模型不需要全知万能,专知专能更为贴合企业需求。
AI大模型解决企业问题会因地而异,因场景而异。生成图片是图片或者设计公司的需求(比如视觉中国),生成广告文案是广告公司的需求。
Midjourney会成为创意图片需求者的最爱,他们也许是美术爱好者、插画师、设计师等等。ChatGPT会成为知识工作者的最爱,他们在写文档,做PPT,读论文。
而陈雨强表示:“中国还没有像OpenAI那样在大模型上绝对领先的公司,中国会有更多的大模型。我们做大模型专注于商业场景,类似大家都在田径赛场上,我们专注于某项比赛,比如跳高,而不是全部。”
这里需要一个“硬核”的例子来加深我们对陈雨强所讲的“软件场景”的理解。
拿工业软件来说,制造能力始终被马斯克认为是特斯拉汽车的核心竞争力,而制造能力背后的技术实力之一就是工业软件。
在高端装备制造行业,数模是数据应用的关键场景。厂商会投入大量时间和资源在数模过程中。
于是,非常专业的问题来了:
1.如何减少数模搜索时间?
2.怎么支持型号内部与跨型号之间的借用与重用?
3.怎么用软件支持现有功能的规模化与系列化?
我认为这里不用搞懂灵魂三问,本质在于这一系列问题的提效与解决能够为制造行业提升产品设计质量带来极大竞争力。
大模型从互联网语料中成长,“场景”换到高端装备制造行业则不然,自研零部件几十万,型号上百万,更别说外采零部件的信息(描述、标签、属性、参数)。
帮我找相似的零件
能不能组装在一起
这里的难度,大模型技术值得一试,将大模型私有化部署到高端装备制造厂,用其珍贵的高端装备数据对大模型进行再学习(Finetune),直至交付。
范式认为,这是值得生成式模型技术去探索解决的地方之一。
式说体现出第四范式找到的大模型商业化、本土化的思考与路径。
谈到软件开发,这里容易有一个误区。大模型生成代码能力良好,可能会有人误认为第四范式用大模型来帮企业生成代码。
并非如此。
总的来说,在企业级大模型需求方面,第四范式着手解决的是软件开发体验、软件开发效率。
“式说”1.0是企业级知识助手,“式说”2.0是Copilot,“式说”3.0是COT(思维链)。
式说只有一小部分功能是生成代码,更重要的是把企业已有API、应用通过Copilot的能力进行串联,形成一个对话框式应用。
比如,飞机起落架的受力和强度是已经设计好的,机长根据飞机类型(轻型重型)、机场跑道强度(雨雪结冰)等情况,决策如何落架,而不是重新设计起落架。
第二阶段的重点是企业级Copilot能力,Copilot支持用对话去调用软件内置的一个个功能/数据来完成任务。
改造软件大模型不能只有语言能力。
式说2.0加入了多模态能力,员工可以通过语音、图像、表格、视频等多模态方式向式说发起询问或下达指令。
不止于Copilot,第三阶段核心技术为COT。
COT有推理能力,企业内部应用库和私有知识与数据进入大模型,在学习大量数据和攻略后,形成中间步骤,从而做到拆分并执行复杂工作。
我理解思维链也是对人的思维行为的一种模仿,人也是一步一步完成任务的,思路也是链路。
大模型是让人血脉偾张的革命,结合中国本土化市场的特点,大模型的私有化部署是大模型落地的必经之路。
我认为,式说这一次的升级意味着,第四范式的业务范围,会从企业级开发者,拓展到软件开发市场。
我推测,第四范式不会仅仅将业务聚焦于AI软件栈的平台一层。
大模型本身已经成为AI基础设施,在上一轮AI大潮中已经拥有基础设施的厂商更有实力倍道而进,这也就意味着,向上一路冲打应用层的机会来了。
近距离观察第四范式四年,他们对AI方法论有独特的理解与洞见,这里谈谈我自己的理解。
企业软件系统非常复杂,如果要全部掌握,其难度不亚于操控一个飞机驾驶舱。
企业软件全局掌握和知识迁移的成本非常高,且有知识门槛。
从企业用户(员工)的角度,不需要理解企业软件界面背后的功能逻辑和执行逻辑。
用户只需要用人类语言(自然语言)沟通就可以使用企业软件的功能,而不需要知道功能处于哪个层级,点击哪个按键,哪个功能位于某个几十级的菜单目录之下。
搜索可以解决简单的查找,对话机器人也可以执行任务,知识库可以编纂成手册。
包括企业知识手册里的内容和软件系统的复杂功能在内的“软件场景”会被大模型学会,大模型帮企业员工来查找,理解,调用,执行。
相当于在所有企业级软件系统里,配备一个指挥官。这个指挥官的背后是大模型的能力。第四范式有千亿级参数生成式大模型,名叫式说大模型。工作的时候,指挥官则听从用户指挥。
假如把企业经营比作一架飞机,每位企业员工都是机长,指挥官就是我们常说的副驾驶,也是英文单词Copilot的直译。
一开始,所有知识都可通过“式说”找到答案,搜索是一种初步形态。
随后,式说学习企业知识库,参照规则做复杂工作。
再往后,式说会有复杂任务拆分和多步推理的能力,产品越“聪明”,能在指挥层面做得越多。
当软件产业被改造以后,整个行业的业务价值、商业模式都会得到飞跃。这是一个巨大的市场。
没有时间可浪费,这可能是这一代国产大模型企业的共同心声。
陈雨强表示:“这个升级做完了以后,我们很多合作伙伴和客户都快速使用上这新技术改造他们自己的软件系统,让软件体验和成本有大幅优化。”
2023年4月下旬,我走访了第四范式,也和范式员工(铁粉读者)有所交流。
他们告诉我:“公司仿佛一下回到刚开始创业那些年,公司大模型产品受到市场的热烈欢迎,用了式说1.0和2.0的客户数量正在以天为单位增加,客户案例在公司内部一抓一大把。”
2023年2月,第四范式发布“式说1.0”,短短两个月时间,我看到发布现场的客户视频中,16家客户侧的应用场景赫然在目。
就在去年,第四范式的客户数量仅仅以月为单位增加,公司在市场上也有意低调。
第四范式成立于2014年,是中国人工智能最早期入局者,倘若能够找到大模型技术为企业创造价值的关键路径,第四范式这家公司将会迎来新一轮增长。
此前那一波AI创业似乎陷入僵局,很多ToB业务竞争极其激烈,又受困于低毛利、高定制化的泥潭中。
第四范式这一轮的新品发布仍然会以企业服务为方向,大模型ToB生意和之前有何不同?
我认为,大模型的私有化部署是一些国内企业的迫切需要,私有化部署的必要性甚至无需多说。
比如,第四范式的部分金融客户要求可断网用,因为内外网完全不通,大模型必须私有化部署。
大模型是新的生产力,得有大模型作为底座,因此,企业级AI市场入局门槛明显变高,从而与中小型竞争者的消耗与摩擦也变少了。
彼时,旧式AI软件更像是一种重要零件或者元器件,在碎片化的市场中找到合适的位置与适合的用途的过程中消耗很大。
这轮大模型技术有望克服AI算法碎片化,独立任务单独解决需要高定制化的窘境。
论其工程规模与成本,不可能是一个低毛利的生意。以大模型基础设施为先导项目,随后建设批量应用,符合商业规律,适合企业级服务市场。
努力就没有白走的路,第四范式找到了大模型企业级服务的方向,矢不虚发。
-结束-
更多阅读
AI框架系列:
1.搞深度学习框架的那帮人,不是疯子,就是骗子(一)
2.搞AI框架那帮人丨燎原火,贾扬清(二)
3.搞 AI 框架那帮人(三):狂热的 AlphaFold 和沉默的中国科学家
4.搞 AI 框架那帮人(四):AI 框架前传,大数据系统往事
注:(三)和(四)现在并未公开发表,将会以图书出版的形式与各位见面。
漫画系列
1. 解读硅谷风投A16Z“50强”数据公司榜单
2. AI算法是兄弟,AI运维不是兄弟吗?
3. 大数据的社交牛逼症是怎么得的?
4. AI for Science这事,到底“科学不科学”?
5. 想帮数学家,AI算老几?
6. 给王心凌打Call的,原来是神奇的智能湖仓
7. 原来,知识图谱是“找关系”的摇钱树?
8. 为什么图计算能正面硬刚黑色产业薅羊毛?
9. AutoML:攒钱买个“调参侠机器人”?
10. AutoML:你爱吃的火锅底料,是机器人自动进货
11. 强化学习:人工智能下象棋,走一步,能看几步?
12. 时序数据库:好险,差一点没挤进工业制造的高端局
13. 主动学习:人工智能居然被PUA了?
14. 云计算Serverless:一支穿云箭,千军万马来相见
15. 数据中心网络:数据还有5纳秒抵达战场
16. 迟到不可怕,可怕的是别人都没迟到, 数据中心网络“卷”AI:
17. 是喜,还是悲?AI竟帮我们把Office破活干完了
AI大模型与ChatGPT系列:
17. ChatGPT大火,如何成立一家AIGC公司,然后搞钱?
18. ChatGPT:绝不欺负文科生
19. ChatGPT触类旁通的学习能力如何而来?
20. 独家丨从大神Alex Smola与李沐离职AWS创业融资顺利,回看ChatGPT大模型时代“底层武器”演进
21. 独家丨前美团联合创始人王慧文“正在收购”国产AI框架OneFlow,光年之外欲添新大将
22. ChatGPT大模型用于刑侦破案只能是虚构故事吗?
23. 大模型“云上经济”之权力游戏
DPU芯片系列:
1. 造DPU芯片,如梦幻泡影?丨虚构短篇小说
2. 永远不要投资DPU?
3. DPU加持下的阿里云如何做加密计算?
4. 哎呦CPU,您可别累着,兄弟CIPU在云上帮把手
长文系列:
1. 我怀疑京东神秘部门Y,悟出智能供应链真相了
2. 超级计算机与人工智能:大国超算,无人领航
最后,再介绍一下主编自己吧,
我是谭婧,科技和科普题材作者。
为了在时代中发现故事,
我围追科技大神,堵截科技公司。
偶尔写小说,画漫画。
生命短暂,不走捷径。
原创不易,多谢转发
还想看我的文章,就关注“亲爱的数据”。