AI智能体技术突破:引领科技新浪潮

news2025/1/24 14:31:22

AI智能体技术突破:引领科技新浪潮

    • 基于大模型的 AI Agent 工作流
    • 基于大模型的 AI Agent 工作流效果
    • AI Agent 的四种设计模式
      • Reflection 反思设计模式
      • Tool use 工具使用设计模式
      • Planning 规划设计模式
      • Multiagent collaboration 多智能体协作设计模式

在这里插入图片描述

吴恩达在红杉美国 AI 峰会上分享了他对 AI Agent 智能体的看法,主要包括以下 3点:基于大模型的 AI Agent 工作流、AI Agent 工作流效果、AI Agent 的四种设计模式。

基于大模型的 AI Agent 工作流

我很期待与大家分享我在 AI Agent 智能体中看到的令人兴奋的趋势,我认为每个 AI 从业者都应该关注这个趋势。

目前,我们使用大语言模型的主要方式是一种非智能体工作流程,即您输入一个提示词,大模型就生成一个回答。这有点像让一个人坐下来一次性从头到尾编写一篇文章,而不允许使用退格键,尽管这样做很难,但大模型的表现出奇地出色。

相比之下,AI Agent 智能体工作流程看起来是这样的(如下图右边所示):一个 AI 大模型,我们让它写一份论文大纲。需要上网查资料吗?如果需要,就联网。然后写初稿、读初稿,并思考哪些部分需要修改。继续修改初稿并推进。
在这里插入图片描述
很多人没有意识到,这种做法可以带来显著的改进效果。我自己在使用这些代理工作流程时也感到非常惊讶,它们工作得如此之好。

总之,这种有迭代反思的做法会带来显著的改进效果。

基于大模型的 AI Agent 工作流效果

比如:给定一个非空整数列表,返回位于偶数位置的所有奇数元素的和。大模型生成的答案是像这样的代码片段(如下图所示):

在这里插入图片描述

事实证明,如果你使用 GPT-3.5,在零样本提示的条件下,GPT-3.5 的准确率是 48%。GPT-4 要好得多,达到了 67%。但如果你采用的是 AI Agent 智能体工作流,并将其打包,GPT-3.5 实际上能表现更好,甚至比 GPT-4 还好。

如果你围绕 GPT-4 构建这样的工作流,GPT-4 也能表现得很好。注意,处于AI Agent 智能体工作流中的 GPT-3.5 实际上优于 GPT-4。这是一个信号

在这里插入图片描述
解释一下上图:Reflection、Tool Use、Planning、Multiagent 是吴恩达提到的四种 Agent 设计模式,后续会详细介绍。

其实基于 Agent 的工作流程才符合人类的习惯,毕竟对于一段复杂的程序,没有一个程序员是从头写到尾的,一般都是先能跑通,然后不断优化重构,补充异常处理,持续迭代优化的过程。

AI Agent 的四种设计模式

Reflection 反思设计模式

很好理解,如果你让大模型写一段代码,它会立马给你一个反馈。这时候你可以将它输出的代码片段再输入回去,让大模型仔细检查它写的代码的准确性、结构规范性等,并且给出评论。

然后再将这些反馈结果输入给大模型,它可能会输出一个比第一版更好的代码。

在这里插入图片描述
我之前描述的是一个单一的编码 AI Agent 智能体 ,你提示它与自己进行交互。这个想法的一种自然延伸是,不是单一的代码 AI Agent 智能体 ,而是有两个AI Agent 智能体,一个是编码 AI Agent 智能体 ,另一个是评审 AI Agent 智能体 。它们可以基于同一个语言模型,但你以不同的方式对它们进行提示,对一个说“你是专业编码者,编写代码”,对另一个说"你是专业代码评审员,评审这段代码"。这种工作流程实际上非常容易实现,我认为它是一种通用技术,可以为很多工作流程带来显著的大语言模型性能提升。

Tool use 工具使用设计模式

相信大家使用 Copliot,或者月之暗面的 Kimi Chat,你给出 Prompt 提示词,它首先会检索互联网上的内容,基于检索到的内容进行总结分析,给出结论。

这个其实就是大模型使用「网页搜索」工具的例子。

再比如:你问大模型,今天的天气如何?这个时候大模型会调用天气预报工具得到今天的的天气状况。

在这里插入图片描述

Planning 规划设计模式

在我进行的一些现场演示中,有些演示会失败,AI Agent 智能体会重新规划路径。我经历过很多这样的时刻。其中一个例子是从 HuggingGPT 论文中改编的,输入的是:请生成一张图片,一个女孩在看书,她的姿态和图像中的男孩一样,再使用你的声音描述这张新图片。

在这里插入图片描述
今天有了 AI Agent 智能体,你可以确定第一件要做的事是确定男孩的姿态,提取姿态。接下来需要找到一个姿态图像模型,遵循指令生成一张女孩的图像。然后使用图像 - 文本模型得到描述。最后使用文本转语音模型读出描述。

Multiagent collaboration 多智能体协作设计模式

多智能体协作,这部分很很有趣,比你想象的好很多,类似于之前大火的 AI 斯坦福小镇。
在这里插入图片描述
吴恩达举的例子是开源项目 ChatDev,你可以让一个大模型扮演不同的角色,比如:公司CEO、设计师、产品经理或测试人员,这些 Agents 会相互协作,共同开发一个 App 或者复杂程序。

虽然不是每次都能成功,但有时确实非常惊艳!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1600761.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

吃透2000-2024年600道真题和解析,科学高效通过2025年AMC8竞赛

为帮助孩子科学、有效备考AMC8竞赛,我整理了2000-2004年的全部AMC8真题(完整版共600道,且修正了官方发布的原试卷中的少量bug),并且独家制作成多种在线练习,利用碎片化时间,8个多月的时间足以通…

【C++题解】1317. 正多边形每个内角的度数?

问题:1317. 正多边形每个内角的度数? 类型:基本运算、小数运算 题目描述: 根据多边形内角和定理,正多边形内角和等于:( n-2 ) 180∘ ( n 大于等于 3 且 n 为整数&#…

Backend - Django Swagger

目录 一、安装依赖 二、配置环境 三、路由(urls) 四、swagger UI 界面 (一)UI 界面 (二)单引号问题:Expecting property name enclosed in double quotes 1. 原因 2. 解决 五、自定义s…

Go 单元测试基本介绍

文章目录 引入一、单元测试基本介绍1.1 什么是单元测试?1.2 如何写好单元测试1.3 单元测试的优点1.4 单元测试的设计原则 二、Go语言测试2.1 Go单元测试概要2.2 Go单元测试基本规范2.3 一个简单例子2.3.1 使用Goland 生成测试文件2.3.2 运行单元测试2.3.3 完善测试用…

基于Adaboost模型的数据预测和分类matlab仿真

目录 1.程序功能描述 2.测试软件版本以及运行结果展示 3.核心程序 4.本算法原理 5.完整程序 1.程序功能描述 AdaBoost(Adaptive Boosting)是一种集成学习方法,由Yoav Freund和Robert Schapire于1995年提出,主要用于提高弱分类…

Docker 学习笔记(九):Docker 网络原理,理解 docker0,虚拟网卡,容器互联,以及跨网络连通

一、前言 记录时间 [2024-4-16] 系列文章简摘: Docker 学习笔记(六):挑战容器数据卷技术一文通,实战多个 MySQL 数据同步,能懂会用,初学必备 Docker 学习笔记(七)&#x…

引领智能互联时代,紫光展锐赋能百业创新发展

随着5G技术的快速发展,各行各业对通信技术的需求也在不断升级。紫光展锐持续深耕5G垂直行业,不断推进5G标准演进,从R15到R16,再到R17,展锐携手生态合作伙伴,不断推出创新性解决方案,在5G RedCap…

FMEA赋能可穿戴设备:打造安全可靠的未来科技新宠!

在科技日新月异的今天,可穿戴设备已成为我们生活中不可或缺的一部分。它们以其便携性、智能化和个性化的特点,深受消费者喜爱。然而,随着可穿戴设备市场的快速扩张,其安全性和可靠性问题也日益凸显。为了确保产品质量,…

【Git】常用命令速查

目录 一、创建版本 二、修改和提交 三、查看提交历史 四、撤销 五、分支与标签 六、合并与衍合 七、远程操作 一、创建版本 命令简要说明注意事项git clone <url>克隆远程版本库 二、修改和提交 命令简要说明注意事项 三、查看提交历史 命令简要说明注意事项 …

Adobe AE(After Effects)2017下载地址及安装教程

Adobe After Effects是一款专业级别的视觉效果和动态图形处理软件&#xff0c;由Adobe Systems开发。它被广泛用于电影、电视节目、广告和其他多媒体项目的制作。 After Effects提供了强大的合成和特效功能&#xff0c;可以让用户创建出令人惊艳的动态图形和视觉效果。用户可以…

OpenCV轻松入门(八)——图片卷积

对图像和滤波矩阵进行逐个元素相乘再求和的操作就相当于将一个二维的函数移动到另一个二维函数的所有位置&#xff0c;这个操作就叫卷积。 卷积需要4个嵌套循环&#xff0c;所以它并不快&#xff0c;除非我们使用很小的卷积核。这里一般使用3x3或者5x5 图像滤波 图像滤波是尽…

Map与Set的模拟实现封装

目录 一. 底层原理 二. 红黑树节点的定义 三. 仿函数封装 四. 基本函数的封装 五. 迭代器的封装 5.1 迭代器的基本定义 5.2 *与->操作 5.3 迭代器的操作 5.3.1 右子树不为空 5.3.2 右子树为空 5.4 迭代器的--操作 5.4.1 当前节点的父节点…

CentOS 7开机启动过程,引导和服务,密码的修改

开机启动过程&#xff1a; 引导过程&#xff1a;1.开机自检(BIOS)->2.MBR引导->GRUB菜单->加载内核kernel->systemd进程初始化 程序&#xff1a;执行特定任务的一串代码&#xff0c;静态&#xff0c;存在硬盘中。 进程&#xff1a;运行中的程序叫进程&#xff0…

第十一章数据仓库和商务智能10分

【数据仓库-后端&#xff0c;商务智能-前端】 基本算法&#xff1a;关联关系&#xff08;牵手-谈恋爱&#xff09;&#xff0c;集群关系&#xff08;杭州人爱吃酸甜口&#xff09;&#xff0c;决策树&#xff0c;线性回归&#xff0c;贝叶斯&#xff0c;神经网络&#xff0c;时…

【Linux】磁盘扩容到根目录逻辑卷(LVM)

目录 一、物理卷和逻辑卷 1.物理卷和逻辑卷的区别 2.在Linux系统中查看所有物理卷的信息 3.在Linux系统中查看所有逻辑卷的信息 二、文件系统 三、实操-对root&#xff08;/&#xff09;目录进行扩容 1.使用lsblk命令查看新加入的磁盘信息 2.fdisk -l命令查看系统中磁盘…

景区导览系统平台|智能导览|数字人导游|VR游园

随着人工智能、元宇宙等技术的飞速发展&#xff0c;文旅行业正迎来一场前所未有的变革。道可云文旅元宇宙平台以其独特的智慧景区导览系统、元宇宙空间以及数字人导游等创新应用&#xff0c;为景区和游客带来了全新的旅游体验&#xff0c;也标志着文旅行业正式步入了元宇宙时代…

含多种需求响应及电动汽车的微网/虚拟电厂日前优化调度

1 主要内容 程序主要建立一个微网/虚拟电厂的日前优化调度模型&#xff0c;以燃气轮机运行成本、购售电费用、电动汽车电池损耗成本以及需求响应费用之和为目标&#xff0c;在日前经济调度模型中&#xff0c;加入了电动汽车模型&#xff0c;考虑了电动汽车出行规律以及充放电规…

华硕ROG幻16笔记本电脑模式切换管理工具完美替代华硕奥创中心管理工具

文章目录 华硕ROG幻16笔记本电脑模式切换管理工具完美替代华硕奥创中心管理工具1. 介绍2. 下载3. 静音模式、平衡模式、增强模式配置4. 配置电源方案与模式切换绑定5. 启动Ghelper控制面板6. 目前支持的设备型号 华硕ROG幻16笔记本电脑模式切换管理工具完美替代华硕奥创中心管理…

环境搭建创建项目_使用DevEco开发工具进行开发_创建项目_认识项目结构---HarmonyOS4.0+鸿蒙NEXT工作笔记001

首先去下载DevEco Studio然后再去安装就可以了 安装下一步下一步非常简单 首先去安装nodejs,可以看到,有两个安装方法,左边是自己安装的制定文件夹就可以了,然后 右边是使用鸿蒙自带的,我们选择第二个 然后我们看这个ohpm其实就跟npm是一个意思,用来管理鸿蒙的包的. 这里我们…

JavaEE:JVM

基本介绍 JVM&#xff1a;Java虚拟机&#xff0c;用于解释执行Java字节码 jdk&#xff1a;Java开发工具包 jre&#xff1a;Java运行时环境 C语言将写入的程序直接编译成二进制的机器语言&#xff0c;而java不想重新编译&#xff0c;希望能直接执行。Java先通过javac把.java…