深聊丨第四范式陈雨强:如何用AI大模型打开万亿规模传统软件市场?

news2024/11/15 19:38:02

ad9c104f307dcedbc604c7e5703abeea.jpeg

文丨亲爱的数据 谭婧

“GPT大模型到底能不能用?用在哪里?”

这是目前中国大型企业一把手最关心的问题之一。AI大模型也被媒体称为“一把手”工程。

大型企业会非常认真地考虑大模型的应用。最近个把月,大型企业客户对大模型的热烈反应让第四范式首席科学家陈雨强感到振奋。

他告诉我,客户中有不少声音提出:

“一家大型传统企业(金融,能源,交通)为了写一首诗、一篇文章、一段摘要或者生成一幅美图就投入研发大模型,这个成本对企业来说,就太高了。”

而面对大模型的企业级市场,客户需求到底是什么?

好奇和质疑同样充斥市场,大型企业正在审慎思考,如何用好“投入巨大费用高昂”大模型,本质还是科技如何给大型企业创造价值。

答案千般万种,而第四范式给出的答案是AIGS,指AI-Generated Software。

范式认为,AI大模型的核心用途在于帮助大型企业提升软件开发流程和效率,以及提升企业软件用户体验。

第四范式的大模型名叫“式说”,是基于多模态大模型底座的开发平台。

从2023年2月到4月,式说产品已完成三代迭代,聚焦于大模型重构企业软件。

到底如何重构,又重构哪里?

软件开发中,To C产品的功能相对比较聚焦,购物、打车、买菜等等;

而To B产品则颇为不同,企业级软件高度定制化,直接面对复杂和繁难问题。

功能和执行的不同逻辑,切十几层菜单不算多,堆成千上万个功能也不算多。此外,企业级软件往往会有很强的知识性,学科知识、业务知识、供应链知识等等。

当企业软件产品的复杂性成为另外一门学问,又会倒逼和影响企业软件开发与设计的思路,这是一种强耦合关系。

对企业软件使用者来说,出错机会多了,上手速度慢了,工作效率低了。

范式认为,这些难处恰恰为生成式AI技术及其发展留下足够的应用空间。这些苦活累活,终于由AI接管了。

b642931ca470ce882e09b9012c19297e.png

帮我执行一个装箱任务

6835959e4577744c90a457998543a9a4.png

44a3e3d7d74b42b8afda0c5480bbc26e.png

28aa79ff7b1e6ca58bd76e38eee331f3.png

a013175ec8f5932c31754951b27fc9e0.png

fef8921209b306d4452130efca098300.png

任务目标:

分析集装箱及小箱子尺寸,设计装箱方案

9eb95fd1167bfb65c182670946ebbafc.png

点击看大图

大家对生成式模型并不陌生了,它有很多特长:文字摘要,篇章总结,迅速画图,多轮对话,耐心解答。

然而,企业经营有目标,从成本角度考虑,一家企业拥有的大模型不需要全知万能,专知专能更为贴合企业需求。

AI大模型解决企业问题会因地而异,因场景而异。生成图片是图片或者设计公司的需求(比如视觉中国),生成广告文案是广告公司的需求。

Midjourney会成为创意图片需求者的最爱,他们也许是美术爱好者、插画师、设计师等等。ChatGPT会成为知识工作者的最爱,他们在写文档,做PPT,读论文。

而陈雨强表示:“中国还没有像OpenAI那样在大模型上绝对领先的公司,中国会有更多的大模型。我们做大模型专注于商业场景,类似大家都在田径赛场上,我们专注于某项比赛,比如跳高,而不是全部。”

这里需要一个“硬核”的例子来加深我们对陈雨强所讲的“软件场景”的理解。

拿工业软件来说,制造能力始终被马斯克认为是特斯拉汽车的核心竞争力,而制造能力背后的技术实力之一就是工业软件。

在高端装备制造行业,数模是数据应用的关键场景。厂商会投入大量时间和资源在数模过程中。

于是,非常专业的问题来了:

1.如何减少数模搜索时间?

2.怎么支持型号内部与跨型号之间的借用与重用?

3.怎么用软件支持现有功能的规模化与系列化?

我认为这里不用搞懂灵魂三问,本质在于这一系列问题的提效与解决能够为制造行业提升产品设计质量带来极大竞争力。

大模型从互联网语料中成长,“场景”换到高端装备制造行业则不然,自研零部件几十万,型号上百万,更别说外采零部件的信息(描述、标签、属性、参数)。

e565376fb28082c00b1ba36d2dcc3cd5.png

帮我找相似的零件

b5d496d3b278c487958534bc2e99c32e.png

e825209ecb423202c95452c79884618d.png

能不能组装在一起

b9875d98777705eb7e3e4bfdcddf6ec0.png

这里的难度,大模型技术值得一试,将大模型私有化部署到高端装备制造厂,用其珍贵的高端装备数据对大模型进行再学习(Finetune),直至交付。

范式认为,这是值得生成式模型技术去探索解决的地方之一。

式说体现出第四范式找到的大模型商业化、本土化的思考与路径。

谈到软件开发,这里容易有一个误区。大模型生成代码能力良好,可能会有人误认为第四范式用大模型来帮企业生成代码。

并非如此。

总的来说,在企业级大模型需求方面,第四范式着手解决的是软件开发体验、软件开发效率。

“式说”1.0是企业级知识助手,“式说”2.0是Copilot,“式说”3.0是COT(思维链)。

式说只有一小部分功能是生成代码,更重要的是把企业已有API、应用通过Copilot的能力进行串联,形成一个对话框式应用。

比如,飞机起落架的受力和强度是已经设计好的,机长根据飞机类型(轻型重型)、机场跑道强度(雨雪结冰)等情况,决策如何落架,而不是重新设计起落架。

第二阶段的重点是企业级Copilot能力,Copilot支持用对话去调用软件内置的一个个功能/数据来完成任务。

改造软件大模型不能只有语言能力。

式说2.0加入了多模态能力,员工可以通过语音、图像、表格、视频等多模态方式向式说发起询问或下达指令。

不止于Copilot,第三阶段核心技术为COT。

COT有推理能力,企业内部应用库和私有知识与数据进入大模型,在学习大量数据和攻略后,形成中间步骤,从而做到拆分并执行复杂工作。

我理解思维链也是对人的思维行为的一种模仿,人也是一步一步完成任务的,思路也是链路。

大模型是让人血脉偾张的革命,结合中国本土化市场的特点,大模型的私有化部署是大模型落地的必经之路。

我认为,式说这一次的升级意味着,第四范式的业务范围,会从企业级开发者,拓展到软件开发市场。

我推测,第四范式不会仅仅将业务聚焦于AI软件栈的平台一层。

大模型本身已经成为AI基础设施,在上一轮AI大潮中已经拥有基础设施的厂商更有实力倍道而进,这也就意味着,向上一路冲打应用层的机会来了。

近距离观察第四范式四年,他们对AI方法论有独特的理解与洞见,这里谈谈我自己的理解。

企业软件系统非常复杂,如果要全部掌握,其难度不亚于操控一个飞机驾驶舱。

企业软件全局掌握和知识迁移的成本非常高,且有知识门槛。

从企业用户(员工)的角度,不需要理解企业软件界面背后的功能逻辑和执行逻辑。

用户只需要用人类语言(自然语言)沟通就可以使用企业软件的功能,而不需要知道功能处于哪个层级,点击哪个按键,哪个功能位于某个几十级的菜单目录之下。

搜索可以解决简单的查找,对话机器人也可以执行任务,知识库可以编纂成手册。

包括企业知识手册里的内容和软件系统的复杂功能在内的“软件场景”会被大模型学会,大模型帮企业员工来查找,理解,调用,执行。

相当于在所有企业级软件系统里,配备一个指挥官。这个指挥官的背后是大模型的能力。第四范式有千亿级参数生成式大模型,名叫式说大模型。工作的时候,指挥官则听从用户指挥。

假如把企业经营比作一架飞机,每位企业员工都是机长,指挥官就是我们常说的副驾驶,也是英文单词Copilot的直译。

一开始,所有知识都可通过“式说”找到答案,搜索是一种初步形态。

随后,式说学习企业知识库,参照规则做复杂工作。

再往后,式说会有复杂任务拆分和多步推理的能力,产品越“聪明”,能在指挥层面做得越多。

当软件产业被改造以后,整个行业的业务价值、商业模式都会得到飞跃。这是一个巨大的市场。

没有时间可浪费,这可能是这一代国产大模型企业的共同心声。

陈雨强表示:“这个升级做完了以后,我们很多合作伙伴和客户都快速使用上这新技术改造他们自己的软件系统,让软件体验和成本有大幅优化。”

2023年4月下旬,我走访了第四范式,也和范式员工(铁粉读者)有所交流。

他们告诉我:“公司仿佛一下回到刚开始创业那些年,公司大模型产品受到市场的热烈欢迎,用了式说1.0和2.0的客户数量正在以天为单位增加,客户案例在公司内部一抓一大把。”

2023年2月,第四范式发布“式说1.0”,短短两个月时间,我看到发布现场的客户视频中,16家客户侧的应用场景赫然在目。

就在去年,第四范式的客户数量仅仅以月为单位增加,公司在市场上也有意低调。

第四范式成立于2014年,是中国人工智能最早期入局者,倘若能够找到大模型技术为企业创造价值的关键路径,第四范式这家公司将会迎来新一轮增长。

此前那一波AI创业似乎陷入僵局,很多ToB业务竞争极其激烈,又受困于低毛利、高定制化的泥潭中。

第四范式这一轮的新品发布仍然会以企业服务为方向,大模型ToB生意和之前有何不同?

我认为,大模型的私有化部署是一些国内企业的迫切需要,私有化部署的必要性甚至无需多说。

比如,第四范式的部分金融客户要求可断网用,因为内外网完全不通,大模型必须私有化部署。

大模型是新的生产力,得有大模型作为底座,因此,企业级AI市场入局门槛明显变高,从而与中小型竞争者的消耗与摩擦也变少了。

彼时,旧式AI软件更像是一种重要零件或者元器件,在碎片化的市场中找到合适的位置与适合的用途的过程中消耗很大。

这轮大模型技术有望克服AI算法碎片化,独立任务单独解决需要高定制化的窘境。

论其工程规模与成本,不可能是一个低毛利的生意。以大模型基础设施为先导项目,随后建设批量应用,符合商业规律,适合企业级服务市场。

努力就没有白走的路,第四范式找到了大模型企业级服务的方向,矢不虚发。

-结束-

530c75ed106e05c5a9038f2634596182.jpeg

更多阅读

AI框架系列:

1.搞深度学习框架的那帮人,不是疯子,就是骗子(一)

2.搞AI框架那帮人丨燎原火,贾扬清(二)

3.搞 AI 框架那帮人(三):狂热的 AlphaFold 和沉默的中国科学家

4.搞 AI 框架那帮人(四):AI 框架前传,大数据系统往事

注:(三)和(四)现在并未公开发表,将会以图书出版的形式与各位见面。

漫画系列

1. 解读硅谷风投A16Z“50强”数据公司榜单

2. AI算法是兄弟,AI运维不是兄弟吗?

3. 大数据的社交牛逼症是怎么得的?

4. AI for Science这事,到底“科学不科学”?

5. 想帮数学家,AI算老几? 

6. 给王心凌打Call的,原来是神奇的智能湖仓

7. 原来,知识图谱是“找关系”的摇钱树?

8. 为什么图计算能正面硬刚黑色产业薅羊毛?

9. AutoML:攒钱买个“调参侠机器人”?

10. AutoML:你爱吃的火锅底料,是机器人自动进货

11. 强化学习:人工智能下象棋,走一步,能看几步?

12. 时序数据库:好险,差一点没挤进工业制造的高端局

13. 主动学习:人工智能居然被PUA了?

14. 云计算Serverless:一支穿云箭,千军万马来相见

15. 数据中心网络:数据还有5纳秒抵达战场

16. 迟到不可怕,可怕的是别人都没迟到, 数据中心网络“卷”AI:

17. 是喜,还是悲?AI竟帮我们把Office破活干完了

AI大模型与ChatGPT系列:

17. ChatGPT大火,如何成立一家AIGC公司,然后搞钱?

18. ChatGPT:绝不欺负文科生

19. ChatGPT触类旁通的学习能力如何而来? 

20. 独家丨从大神Alex Smola与李沐离职AWS创业融资顺利,回看ChatGPT大模型时代“底层武器”演进

21. 独家丨前美团联合创始人王慧文“正在收购”国产AI框架OneFlow,光年之外欲添新大将

22. ChatGPT大模型用于刑侦破案只能是虚构故事吗?

23. 大模型“云上经济”之权力游戏

DPU芯片系列:

1. 造DPU芯片,如梦幻泡影?丨虚构短篇小说

2. 永远不要投资DPU?

3. DPU加持下的阿里云如何做加密计算?

4. 哎呦CPU,您可别累着,兄弟CIPU在云上帮把手

长文系列:

1. 我怀疑京东神秘部门Y,悟出智能供应链真相了

2. 超级计算机与人工智能:大国超算,无人领航

3275f8b41df874c74f5158f4da65fa9f.jpeg

a8d60f5a96fa62b24b137d5b56bf8466.png

最后,再介绍一下主编自己吧,

我是谭婧,科技和科普题材作者。

为了在时代中发现故事,

我围追科技大神,堵截科技公司。

偶尔写小说,画漫画。

生命短暂,不走捷径。

原创不易,多谢转发

还想看我的文章,就关注“亲爱的数据”。  

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/466997.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

进程状态以及两种特殊进程

目录 进程状态1 具体状态2 进程状态的意义3 进程状态实例3.1 R&S&T认识3.2 认识Z & 僵尸进程 & 孤儿进程僵尸进程孤儿进程 进程状态 为了弄明白正在运行的进程是什么意思,我们需要知道进程的不同状态。一个进程可以有几个状态(在Linux内…

==、equals区别 | java学习笔记

做一些java基础知识的记录📕 java基本类型:byte short int long float double char boolean(指向具体的数值) java引用类型:类 接口 数组等。指向的不是具体的数值,而是指向了对象的地址。 用于判断基本类…

JavaWeb|在IDEA中创建基于Maven的Web项目| Servlet依赖|这一篇就够了(超详细)

🙈作者简介:练习时长两年半的Java up主 🙉个人主页:老茶icon 🙊 ps:点赞👍是免费的,却可以让写博客的作者开兴好久好久😎 📚系列专栏:Java全栈,计…

【c语言】详解c语言#预处理期过程 | 宏定义前言

c语言系列专栏&#xff1a; c语言之路重点知识整合 创作不易&#xff0c;本篇文章如果帮助到了你&#xff0c;还请点赞支持一下♡>&#x16966;<)!! 主页专栏有更多知识&#xff0c;如有疑问欢迎大家指正讨论&#xff0c;共同进步&#xff01; 给大家跳段街舞感谢支持…

微信小程序php+python+nodejs+vue大学生心理健康测试职位推荐系统

心理测试开发使系统能够更加方便学生捷&#xff0c;同时也促使心理测试变的更加系统化、有序化。系统界面较友好&#xff0c;易于操作。具体在系统设计上&#xff0c;客户端使用微信开发者&#xff0c;后台也使用php技术在动态页面上进行了设计&#xff0c;Mysql数据库&#xf…

算法 DAY44 动态规划6 完全背包 518. 零钱兑换 II 377. 组合总和 Ⅳ

完全背包 有N件物品和一个最多能背重量为W的背包。第i件物品的重量是weight[i]&#xff0c;得到的价值是value[i] 。每件物品都有无限个&#xff08;也就是可以放入背包多次&#xff09;&#xff0c;求解将哪些物品装入背包里物品价值总和最大。 完全背包和01背包问题唯一不同…

Java每日一练(20230427)

目录 1. 螺旋矩阵 2. LRU 缓存机制 3. 解数独 &#x1f31f; 每日一练刷题专栏 &#x1f31f; Golang每日一练 专栏 Python每日一练 专栏 C/C每日一练 专栏 Java每日一练 专栏 1. 螺旋矩阵 给你一个 m 行 n 列的矩阵 matrix &#xff0c;请按照 顺时针螺旋顺序 &#…

Leetcode——495. 提莫攻击

&#x1f4af;&#x1f4af;欢迎来到的热爱编程的小K的Leetcode的刷题专栏 文章目录 1、题目2、题目分析3、题解代码 1、题目 题目链接&#xff1a;Leetcode——495. 提莫攻击 在《英雄联盟》的世界中&#xff0c;有一个叫 “提莫” 的英雄。他的攻击可以让敌方英雄艾希&…

国民技术N32G430开发笔记(1)-macos开发环境搭建

macos开发环境搭建 1、安装arm-none-eabi- 工具链 brew tap ArmMbed/homebrew-formulae brew install arm-none-eabi-gcc如果没有安装brew&#xff0c;请先安装brew。 2、安装vscode 3、安装pyocd a、python官网下载最新版的python b、pip3 install -U pyocd 我的开发板为N3…

Hadoop 1:Apache Hadoop、HDFS

Hadoop核心组件 Hadoop HDFS&#xff08;分布式文件存储系统&#xff09;&#xff1a;解决海量数据存储 Hadoop YARN&#xff08;集群资源管理和任务调度框架&#xff09;&#xff1a;解决资源任务调度 Hadoop MapReduce&#xff08;分布式计算框架&#xff09;&#xff1a;解决…

MyBatis的代理开发方式、动态sql语句和typeHandlers和plugins标签实战

文章目录 Mybatis的Dao层实现传统开发方式编写UserDao接口编写UserDaoImpl实现mapper文件测试传统方式 代理开发方式代理开发方式介绍编写UserMapper接口测试代理方式 MyBatis映射文件深入动态sql语句动态sql语句概述动态 SQL 之<if>动态 SQL 之<foreach>SQL片段抽…

信号处理的本质是什么?

信号处理的宗旨是“将信号中蕴涵的信息变得显然”&#xff0c;从数学角度分析, 信号即是某个物理量x的函数f(x), 信号所蕴含的信息需要通过此类函数予以揭示. 自然地可将f(x)投影到其所在空间中的一组基函数上, 由投影系数或加权系数来构成函数f(x)在变换域上的表示。在一定条件…

Nginx基本配置

文章目录 准备环境安装NginxNginx配置初始配置信息配置详解1. 全局块2. events 块3. http 块3.1 http 全局块3.2 server 块3.2.1 全局 server 块3.2.2 location 块 启动Nginx 参考资料 本教程讲述Nginx的基本配置和操作。首先需要安装 Nginx&#xff0c;关关于具体的安装方式&a…

输入网址url到网页显示,期间发生了什么?

当我们在浏览器输入一个网址后&#xff0c;知道网页显示在我们眼前&#xff0c;这一期间是如何发生的&#xff0c;接下来就将详细介绍在这期间发生的过程及使用的协议栈 1、浏览器解析URL并生产HTTP请求消息 URL是我们输入的网址信息&#xff0c;比如 https://www.taobao.com …

JavaScript 知识总结下篇(更新版)

91.实现一个 promise 参考链接&#xff1a;实现一个完美符合Promise/A规范的Promise Issue #4 forthealllight/blog GitHub function myPromise(constructor) {let self this;self.status "pending" // 定义状态改变前的初始状态self.value undefined;// 定义状…

c++调用java方法详解

当我们使用 Java程序调用C程序时&#xff0c;我们可以使用JAVA_HOME类来访问 Java虚拟机中的类&#xff0c;并使用其提供的方法来调用 Java方法。 使用JAVA_HOME类调用 Java方法时&#xff0c;可以在 JVM中直接操作 Java虚拟机。这个方法称为“直接访问”&#xff08;Direct Ac…

华为交换机配置telnet登录图文教程

一、配置交换机管理vlan和地址&#xff0c;配置交换机接口 1.关闭多余的信息提示&#xff1a; [Huawei]undo in en Info: Information center is disabled. [Huawei] 2.交换机配置 在工作中通过Telnet方式登录交换机进行设备登录管理能更加便利&#xff0c;不需要到机房里…

7.参数校验

在controller和service进行前端传参校验&#xff0c;保证存到数据库的数据是正确的 1.引入依赖 <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-validation</artifactId></dependency>这里无需…

科技云报道:生成式AI大模型,或将撼动云服务市场格局

科技云报道原创。 随着ChatGPT、GPT-4、BARD等生成式AI大模型的爆火&#xff0c;云服务商围绕生成式AI的竞争日趋激烈。 微软将Azure的企业级功能与OpenAI的生成式AI模型功能相结合&#xff0c;发布了Azure OpenAI服务&#xff1b; 紧随其后&#xff0c;谷歌开放了AI大模型Pa…

File类知识梳理(包含输入输出流的使用)

前言 学习的思维导图 目录 1. File类是什么? 2. 关于文件系统的操作 3. 关于文件内容的操作 3.1 文本文件 3.2 二进制文件 4. 案例实现练习 5.拓展:try with resources 操作 1. File类是什么? ● 概念 它的实例化对象是对硬盘上文件或目录的抽象表示.文件存储在硬盘…