AutoGPT不靠谱,微软推出升级版!可编辑自主规划过程

news2025/1/18 20:17:57

65e572a76f7ebe042d1728355aaf68d5.png  夕小瑶科技说 原创
 作者 | iven

火遍全网的AutoGPT[1]在Github收藏量突破十万。这种自我规划、自我执行的智能体首次关注人工智能模型内部的自我调整与优化。

但是有不少网友发现,AutoGPT的表现不稳定,死循环是最常见的现象。此外,AutoGPT执行速度很慢,据网友测试,New Bing需要8s的任务,AutoGPT用了整整8分钟!

AutoGPT的工作方式使得它对与单个任务要调用很多次API,据计算单次任务的成本就超过了100元!显然这样的花费对于个人使用是昂贵的。

微软研究院近日新工作提出Low-code LLM,通过简单的可视化操作通过拖拖拽拽的方式与智能体进行协作。

1fa61469e834d472e426e1f2897bd362.jpeg

该模式首先让GPT生成一个任务流程图,这点与AutoGPT的自我规划自我执行的逻辑很为相像,但不同的是,用户可以直观地轻松地了解和修改整个执行流程,从而有效控制人工智能的操作。

之所以称为“Low-code”,是因为它采用了可视化编程的概念,用户只需通过简单的点击和拖拽就可以对流程进行调整。对于复杂的任务,用户可以将自己的想法或偏好有效地对智能体进行控制。

Low-code LLM生成流程图是在一次对话中完成的,调用API的花费基本可以忽略不计,而且这样一次性生成流程图的方式也避免了AutoGPT中死循环的问题,使得服务更加稳定!

作者发现这项工作放在微软TaskMatrix.ai[2]的Repo里,已经超过30k star。Visual ChatGPT[3]也来自同一团队。TaskMatrix.AI展现了如何连接foundation models和大量的各领域的api实现Task Automation(Visual ChatGPT就是其在视觉领域的一个经典范例)。最新推出的Low-code LLM则可以在与用户交互方面发挥作用,帮助用户让AI更理解用户到底想做什么。

论文地址:
https://arxiv.org/abs/2304.08103

论文题目:
"Low-code LLM: Visual Programming over LLMs."

开源代码:
https://github.com/microsoft/TaskMatrix/tree/main/LowCodeLLM

演示Demo:

工作流程

c113b7428e0ffe19ff27ec6382587b31.png
  1. Planning LLM对复杂的任务生成一个结构化的流程图,这点有点类似AutoGPT通过用户给出的目标进行自我规划的思路

  2. 用户通过定义好的低代码可视化操作修改流程图(包括点击、拖拽、文本编辑),将自身的偏好、观点传达给LLM

  3. Executing LLM按照用户修改好的工作流程执行命令,生成回答

  4. 用户可以参考当前的回答不断修改流程图,直到获得满意的结果

48c17687c89604ebdb78028711e50a81.png

预定义的6类low code操作

26beb03391d9feafb8f72441ce3b0d24.png

该模式的优点如下:

  1. 更可控的生成结果:用户可以直接了解并控制人工智能的执行逻辑,使结果更容易被预测和控制,更符合用户的需求;

  2. 用户友好的交互界面:用户可以直观地看到执行流程,点击和拖拽方式也使得操作更加便捷,提高了工作效率;

  3. 广泛的应用场景:该方法可以应用于许多领域,特别是那些用户的想法和偏好至关重要的场景,文中提出了4种典型案例。

此外,Low-code LLM还可以与外部API扩展,进一步丰富场景应用。例如,高效传达用户想法和偏好,帮助用户实现任务自动化。在对接其他工具时,可以将视觉和语音等多种功能整合进来。

AutoGPT和Low-code LLM都在努力提升人工智能模型的性能和效果,前者关注模型内部的自我优化和学习,后者关注用户与模型之间的协同和交互。这两种方法可以相互补充,在不同场景和任务下取得更好的表现。

论文的致谢部分,还提到了这篇文章部分就是通过这种模式进行合作生成的,看来未来人和大模型紧密合作共创不再是梦。

c16b07084f3ea659c5eef9d1e571f2af.png cbcb09840f757737e6f0a912e782174b.png ca32deaac498dde13e62a2fa9609f182.png

参考资料

[1]

AutoGPT: https://github.com/Significant-Gravitas/Auto-GPT,

[2]

TaskMatrix.ai: https://arxiv.org/abs/2303.16434

[3]

Visual ChatGPT: https://arxiv.org/abs/2303.04671,

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/470328.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

输入指令为±10V或4~20mA型伺服阀控制器

工作电压 19~35 VDC(常规24VDC) 最大功率消耗 <25VA 空载电流 ≤100mA(24V) 差分信号输入 0~10 V,输入阻抗≥100KΩ 4~20 mA,输入阻抗100Ω (出厂前需指定,现场不可…

免费的ERP系统哪个好?这款让管理更高效

阅读本文你将了解:ERP是什么?解决什么问题?ERP选型的参考维度?零代码ERP系统解决哪些场景问题? 题目提到“免费”,其实很难有软件可以真正做到。 商业化市场决定了没有一家厂商可以不落俗套。因而我们要探…

[架构之路-177]-《软考-系统分析师》-17-嵌入式系统分析与设计 -2- 系统分析与设计、低功耗设计

目录 1 7 . 4 嵌 入 式 系 统 开 发 17.4.1 开发平台 1 . 交叉开发环境 2 . 交叉编译环境 17. 2 开发流程 1. 过程模型 2 . 分析与设计方法 17.4.3 软硬件协同设计 1 . 软 硬 件 协 同 设 计 方 法 2 . 协 同 设 计 工 具 17.4.4 系统分析与设计 1 . 需求分析 2 .…

CI/CD: GitLab Runner安装注册配置管理

点击上方蓝字⭐️关注“DevOps云学堂”,接收最新技术实践 今天是「DevOps云学堂」与你共同进步的第 21 天 本文是《GitLabCI实践》教程部分内容 GitLab Runner是一个开源项目,用于运行您的作业并将结果发送回GitLab。它与GitLab CI结合使用,G…

计算机网络学习10(ARP协议详解)

ARP 协议,可以说是在协议栈中属于一个偏底层的、非常重要的、又非常简单的通信协议。 开始阅读这篇文章之前,你可以先看看下面几个问题: ARP 协议在协议栈中的位置? ARP 协议在协议栈中的位置非常重要,在理解了它的工…

Linux 内存 pt.1

哈喽大家好,我是咸鱼 今天我们来学习一下 Linux 操作系统核心之一:内存 跟 CPU 一样,内存也是操作系统最核心的功能之一,内存主要用来存储系统和程序的指令、数据、缓存等 关于内存的学习,我会尽量以通俗易懂的方式…

R语言的基本数学运算

目录 一、对象命名原则 二、基本数学运算 2.1 四则运算 2.2 余数和整除 2.3 次方或平方根 2.4 绝对值 2.5 exp()与对数 2.6 科学符号e 2.7 圆周率与三角函数 2.8 四舍五入函数 2.9 近似函数 2.10 阶乘 三、R语言控制运算的优先级 四、无限大 五、非数字&#xf…

OpenCV 实战3 对图像画框、获取图像像素位置

一、函数介绍 opencv中进行鼠标操作主要用到setMouseCallback这个函数,如下: void setMouseCallback(const String& winname, MouseCallback onMouse, void* userdata 0); winname:窗口名称 onMouse:鼠标响应函数&#x…

直击德国PLS展,联诚发倾力打造沉浸式视觉盛宴!

当地时间4月25-28日,备受关注的2023德国法兰克福国际专业灯光音响展ProlightSound(以下简称“PLS展”)在德国法兰克福盛大召开。联诚发携多款创新产品及多领域的应用解决方案精彩亮相,为全球客户打造沉浸式视觉盛宴,展…

HNU-计算机系统-实验1-PrototypeSystemLab

《计算机系统》 原型机实验报告 班级:计科21XX 学号:20210801XXXX 姓名:wolf 目录 1 实验项目一 1.1项目名称 1.2实验目的 1.3实验资源 2 实验任务 2.1原型机I 2.1.1练习内容 2.1.2思考问题 2.2原型机II-扩充指令集 2.2.1…

《编程思维与实践》1040.字符串消除

《编程思维与实践》1040.字符串消除 题目 思路 每次消除都可能会受到第一次插入字符的影响,所以难以直接判断在哪个位置插入哪个字符后消除的字符数最多. 因此考虑暴力枚举: 在每个位置依此插入A,B,C 对所有情况消除的字符数进行比较,求出最大值. 对于字符串的插入可以利用str…

这个看过吗

el-upload调两个接口&#xff0c;获取二进制文件 &#xff0c;并且上传后不立即执行&#xff0c;通过 this.$refs.upload.submit();触发提交&#xff0c;直接调两个接口&#xff0c;获取到二进制文件后传输 <el-upload:auto-upload"false":data"{report…

springboot+vue在线动漫信息平台(源码+文档)

风定落花生&#xff0c;歌声逐流水&#xff0c;大家好我是风歌&#xff0c;混迹在java圈的辛苦码农。今天要和大家聊的是一款基于springboot的在线动漫信息平台。项目源码以及部署相关请联系风歌&#xff0c;文末附上联系信息 。 &#x1f495;&#x1f495;作者&#xff1a;风…

TPS和QPS的区别与联系

今天在工作中遇到了两个指标&#xff0c;将这两个指标作以解析。 1、TPS&#xff1a; Transactions Per Second&#xff0c;意思是每秒事务数。一个事务是指客户端向服务器发送请求然后服务器做出反应的过程&#xff0c;具体的事务定义&#xff0c;可以是一个接口、多个接口、…

IDEA中application.yaml文件无法自动提示

问题描述&#xff1a; 在IDEA中application.properties可以自动提示&#xff0c;但是application.yml/application.yaml文件却不可以实现关键词提示和代码跳转 甚至&#xff0c;在Modules模块中都无法识别到application.yml文件&#xff01;&#xff01; 总感觉这个yml文件图标…

【C++学习】类和对象--继承

基本语法 继承是面向对象三大特性之一&#xff0c;有些类和类之间存在特殊关系。 下级别成员除了拥有上一级的共性还有自己的特点。 这个时候我们就可以考虑利用继承的技术&#xff0c;减少重复代码。 基本语法&#xff1a;class 子类 &#xff1a;继承方式 父类 子类也称为…

【HTML 标签详解】

&#x1f389;&#x1f389;&#x1f389;点进来你就是我的人了 博主主页&#xff1a;&#x1f648;&#x1f648;&#x1f648;戳一戳,欢迎大佬指点!人生格言&#xff1a;当你的才华撑不起你的野心的时候,你就应该静下心来学习! 欢迎志同道合的朋友一起加油喔&#x1f9be;&am…

MySQL(三)-数据类型

MYSQL数据类型 1 整数类型2 浮点数类型和定点数类型3 日期与时间类型4 文本字符串类型5 二进制字符串类型6 数据类型的选择 表是由多列字段组成&#xff0c;每一个字段会有不同的数据类型&#xff0c;不同的数据类型决定了字段包含的数据内容。不同的数据类型也决定了mysql在使…

SpringBoot项目结构及依赖技术栈

目录 1、pom.xml文件配置说明 2、SpringBoot项目结构说明 3、入门案例关键配置说明 &#x1f308; 前面我们学习了SpringBoot快速入门案例&#xff0c;本节我们通过POM文件和项目结构分析两部分内容了解下关于SpringBoot的一些配置说明&#xff0c;以便全面了解SpringBoot项…

Javaweb | 转发、重定向

&#x1f497;wei_shuo的个人主页 &#x1f4ab;wei_shuo的学习社区 &#x1f310;Hello World &#xff01; 转发 转发与页面跳转 转发 转发的作用在服务器端&#xff0c;将请求发送给服务器上的其他资源&#xff0c;以共同完成一次请求的处理 页面跳转 使用forward跳转时&am…