第四范式涂威威:企业专属大模型技术需闭环数据、思维链学习、高落地效率...

news2025/1/16 2:42:28

近日,以“智行天下 能动未来”为主题的第七届世界智能大会隆重举办,第四范式副总裁、主任科学家涂威威出席高峰会,与中国工程院院士邬江兴、德国弗劳恩霍夫电子纳米系统研究所所长Harald Kuhn、高通公司中国区董事长孟樸等院士及企业代表,同台共话大模型等智能科技在产业中的创新应用。

b612b53296f427a7cabc7662e80daadf.jpeg

涂威威表示,生成式AI让企业软件的人机交互和应用价值内核价值都有了质的提升,打造数据闭环是企业落地成功的关键,结合环境学习让机器从真实决策环境中学习更高层级的目标是打造更强智能助手的重要手段。

企业软件使用遵循“二八法则”,即用户普遍只能使用其中20%的功能,软件的价值难以充分发挥,此外,功能的开发和迭代效率低下。生成式AI的出现让企业软件以「对话框式」实现功能的调用,不再需要找到某个位于十几级菜单目录下的功能,或者耗费过多精力在软件界面的开发环节。

这样一个智能助理甚至可以通过思维链的方式调用多种功能,帮助企业用户完成多步骤复杂的任务,也可以利用AI对软件的核心功能进行智能化改造,让传统软件内核从增删改查等基础工具,变革为能够解决感知、预测、决策、执行等问题的生产力工具。

实现这个更强大的智能助理的核心就是大模型。涂威威同时指出,企业想要落地专属大模型应用,需要满足以下3大条件:形成高质量的闭环数据、具备多步推理思维链(Chain of thoughts)的学习能力、解决大模型落地效率问题。

在闭环数据方面,大模型的背后还是机器学习,即利用数据训练模型。数据的质量决定了模型的最终效果,所以优质的训练数据是大模型落地应用的重中之重。基于此,需要用户的反馈形成高质量的闭环数据,进一步优化迭代大模型。其中,面对大模型中“知识”过时等问题时,大模型可以借用Memory机制,在外部有策略地获得对大模型有帮助且更加实时、可信的数据,从而可靠地解决用户实际的问题。大模型在垂直场景落地时,实际效果往往取决于业务定义的优劣,而不只是语义上的相关与否,因此大模型需要从用户的反馈中学习,来帮助用户越用越好。

ff93bac992d1b27a0dd6233663874fb0.png

在思维链学习方面,为了让生成式AI这样的智能助手能够像人一样,处理更多复杂的问题,除了通过类似ChatGPT的Plugin模式以外,大模型还需要能够根据业务学习具备多步推理能力来形成长程序列决策的能力,即思维链学习的能力。现有的RLHF方法由于只是单步,所以本质上只是考虑当前回答是否满足用户定义的Reward Model。

解决更加复杂的多步序列决策任务,较为简单的方式是利用如模仿学习等方式让机器模仿专家解决复杂问题的过程,理想情况下可以逼近专家的水平,这样的方式的上限受限于人类专家的水平,就像AlphaGo单靠学习人类棋谱可以击败实力相对较弱的人类选手,但很难超越顶尖选手一样。为了能进一步提升,突破人类专家的能力上限,可以用大模型提供的基础世界常识模型,结合环境学习,让机器从真实的决策环境中学习更高层级的目,通过离线训练与在线微调结合的方式,在获得高阶推理能力的同时,大幅降低试错成本。这也是未来打造更强企业智能助手的核心手段。

在大模型落地效率方面,No Free Lunch定理告诉我们,没有哪一个模型能以最优的方式解决所有的问题,企业预算始终是有限的,企业落地大模型更合理的做法不是把所有的预算都投入到一个超级大模型中,而是可以通过组合多个专业模型各司其职来解决。这就如同人类大脑有不同的分区,不同分区负责不同职责一样。这种方式更利于模型迭代、维护,同时更利于控制成本。第四范式也正在基于南京大学LAMDA实验室提出的“学件”思想构建可重用、可演进和可了解的企业级大模型学件群组。

d80b0704f91f93dd155b235b59c19e31.png

今年2月,第四范式正式发布了「式说」大模型,后提出“以生成式AI重构企业软件(AIGS)”的技术战略,提升企业级软件的体验及开发效率。目前已与金融、零售、制造、医疗、房产、运营商等近百家合作伙伴及企业探索大模型的落地合作。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/557583.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

chatgpt赋能Python-python_for_in遍历列表

Python for-in循环遍历列表:最简单易用的方法 Python是最流行的编程语言之一,也是许多开发人员的首选工具。其中,for循环是Python最重要的控制结构之一, for-in循环是其中最常用的形式之一。在本文章中,我们将重点介绍…

做流量卡代理,看看人家是怎么赚钱的?

这两年来,流量卡市场可谓是一片欣欣向荣,三大运营商也推出了多款热门套餐。 ​ 作为上网的主要方式,流量卡在这两年可谓是“风光无限”,上至60岁老人,下至16岁的学生都在使用,就连小编的亲戚朋友也都在网上…

chatgpt赋能Python-python_gi

Python-GI: 一个强大的Python库 Python-GI是一个用于Python的开源库,它提供了一个统一的接口来访问底层的系统库。这个库的目的是方便Python开发人员使用底层操作系统或系统库的底层功能。Python-GI是GNOME桌面环境的一部分,它为Python开发人员提供了访…

因果

数字化转型已经喊了很多年了,但是很多人仍然不明白数字化转型是怎么回事,为啥要转。很多人甚至以为数字化转型就是个营销噱头,还有人跟着瞎起哄什么互联网红利消失、中国供给侧和消费侧人口红利消失等等。 我不讲,很多人都不知道。…

字节跳动开源其云原生数据仓库 ByConity

动手点关注 干货不迷路 ‍ ‍项目简介 ByConity 是字节跳动开源的云原生数据仓库,它采用计算-存储分离的架构,支持多个关键功能特性,如计算存储分离、弹性扩缩容、租户资源隔离和数据读写的强一致性等。通过利用主流的 OLAP 引擎优化&#xf…

吴恩达 x OpenAI Prompt Engineering教程中文笔记

Datawhale干货 作者:刘俊君,Datawhale成员 完整课程:《吴恩达ChatGPT最新课程》 🐳Reasons & Importance Important for research, discoveries, and advancement 对研究、发现和进步很重要 Accelerate the scientific resea…

案例15:Java餐厅外卖管理系统设计与实现开题报告

博主介绍:✌全网粉丝30W,csdn特邀作者、博客专家、CSDN新星计划导师、java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ 🍅文末获取源码联系🍅 👇🏻 精彩专…

一步步教你安装RabbitMQ Server在Ubuntu上,并让其支持远程访问!

文章目录 前言1.安装erlang 语言2.安装rabbitMQ3. 内网穿透3.1 安装cpolar内网穿透(支持一键自动安装脚本)3.2 创建HTTP隧道 4. 公网远程连接5.固定公网TCP地址5.1 保留一个固定的公网TCP端口地址5.2 配置固定公网TCP端口地址 转载自cpolar内网穿透的文章:无公网IP&…

针对自主泊车的多相机视觉惯导同时定位与建图方案

文章:Multi-Camera Visual-Inertial Simultaneous Localization and Mapping for Autonomous Valet Parking 作者:Marcus Abate, Ariel Schwartz, Xue Iuan Wong, Wangdong Luo, Rotem Littman, Marc Klinger, Lars Kuhnert, Douglas Blue, Luca Carlone…

chatgpt赋能Python-python_geohash

Python GeoHash: 将位置信息转换为字符串 在现代生活中,我们经常需要处理和分析大量的位置信息,包括地图、GPS、定位等。而一种流行的做法是将位置信息转换为字符串,并使用该字符串进行存储、传输和查询。GeoHash就是一种将位置信息压缩为字…

Tomcat之服务管理页面manager部署

一、tomcat服务管理页面manager简介 Tomcat的管理页面Manager是一个Web应用程序,用于管理Tomcat服务器的部署和操作。它提供了一个易于使用的界面,可以通过Web浏览器访问。Manager可以帮助管理员对Tomcat服务器进行以下操作: 部署/卸载Web应…

chatgpt赋能Python-python_gil

简介 Python(特别是 CPython 实现)有一个全局解释器锁(Global Interpreter Lock,简称 GIL),它的作用是确保只有一个线程可以执行 Python 代码。这让多线程 Python 程序的并发性有所限制。 为什么需要 GIL…

谁在杀死 ChatGPT ?

作者| Mr.K 编辑| Emma 来源| 技术领导力(ID:jishulingdaoli) AI浪潮汹涌而来,离我们越来越近,有时候近到只差一个APP的距离。很多人把AI科技可能带来的全方位社会变革,称之为第四次科技革命,把ChatGPT称为“第四次科…

【010】C++运算符详解

C运算符详解 引言一、运算符概述二、算术运算符三、复合运算符四、关系运算符五、逻辑运算符六、位运算符&#xff08;二进制位运算&#xff09;6.1、& 按位与6.2、| 按位或6.3、~ 按位取反6.4、^ 按位异或6.5、<< 左移&#xff1a;左边丢弃&#xff0c;右边补零6.5、…

MySQL高级篇——排序、分组、分页优化

导航&#xff1a; 【Java笔记踩坑汇总】Java基础进阶JavaWebSSMSpringBoot瑞吉外卖SpringCloud黑马旅游谷粒商城学成在线MySQL高级篇设计模式牛客面试题 目录 5. 排序优化 5.1 排序优化建议 5.2 测试 5.2.1 案例验证 5.3.2 练习 5.3 范围查询时索引字段选择 5.4 filesor…

chatgpt赋能Python-python_fem

Python在有限元分析中的应用 什么是有限元分析 有限元分析&#xff08;Finite Element Analysis, FEA&#xff09;是一种针对工程结构、材料及其它物理现象进行数值仿真的方法。它通过将结构或者物理现象的连续域分割成有限个小元素&#xff0c;再在每个小元素中建立数学模型…

【搭建HTTP服务器】使用Nodejs搭建简单的HTTP服务器

文章目录 前言1.安装Node.js环境2.创建node.js服务3. 访问node.js 服务4.内网穿透4.1 安装配置cpolar内网穿透4.2 创建隧道映射本地端口 5.固定公网地址 前言 Node.js 是能够在服务器端运行 JavaScript 的开放源代码、跨平台运行环境。Node.js 由 OpenJS Foundation&#xff0…

当在网页浏览器的地止栏中输入URL或关键词时,web页面是如何呈现的?

前言 当我们在浏览器中输入一个url,或在搜索引擎或网站内,输入一个关键词进行搜索时,页面发生了什么呢? 即使不了解其中的原理,也能看到web页面 在浏览器地止栏内输入一个url之后,信息会被传到某些地方(后台,可以成为服务端)&#xff0c;然后后台得到响应后,从后台(服务端)返回…

Day4——数据库基础1(已完结)

Day4——数据库基础 数据库基础--基于phpstudy自带的MySQL数据库&#xff08;下载了PHPstudy后就无需下载额外的MySQL&#xff09; 一、数据库概念1、为什么要学习数据库&#xff1f;2、什么是数据库&#xff1f;3、数据库的访问方式4、数据管理技术经历的三个阶段5、关系型数据…

YOLOv5区域检测计数+声音警报

YOLOv5区域检测计数声音警报 1. 相关配置2. 检测区域设置3. 画检测区域线&#xff08;不想显示也可以不画&#xff09;4. 报警模块5. 计数模块6. 代码修改6.1 主代码6.2 细节修改&#xff08;可忽略&#xff09; 6. 实验效果 本篇博文工程源码下载 链接1&#xff1a;https://gi…