Auto-GPT 迈向智能体的第一步——从信息增强和上下文理解开始

news2024/11/27 10:31:37

Auto-GPT 的出现,意味着 AI 已经能够在没有人工干扰的情况下独立地完成目标任务。这个在 GitHub 中不断创造历史的项目,正以惊人的速度发展着、变化着。

这样前沿又带有科幻色彩的技术项目,引起了各方关注,开发者、投资人、媒体人,难掩对 Auto-GPT 的热情。作为相关领域的技术开发者,我们自然也不例外。

今天,我们将带着对它连月以来的探索和实践,和大家探讨 Auto-GPT 的背后原理、局限性及其背后的解决方案。

Auto-GPT 究竟是什么?

Auto-GPT 是一个开源的自动化人工智能的实验项目,利用 LLM 来拆分任务与计划任务,并配合附属的额外可执行指令来达成用户提供的目标。

通俗点来理解,Auto-GPT 使用以 GPT 为代表的大语言模型(LLM)和人类反馈来分析和分解大型任务,并将特定的命令分配给这些已被分解的小任务且自动执行,同时命令执行结果又会作为下一轮认知处理的输入。上述程序会重复进行,直到 Auto-GPT 完成任务。

由此,我们便可以认识到,Auto-GPT 整体有两个核心部分:LLM 和命令集。一方面, LLM(如 GPT),负责认知处理。另一方面,Auto-GPT 内置了非常多命令组件,比如文件读写、代码分析、搜索能力、网页分析等等。加之 Auto-GPT 目前支持第三方的插件式开发,命令集得以大大拓展。据悉,目前它已经可以支持向必应、百度等进行搜索。有趣的是,这些插件和命令很多也是依赖于大语言模型得以实现,例如网页和代码分析能力等。

可以说,LLM 就是 Auto-GPT的“大脑”,叠加各种插件 buff 加成的命令集就像是 Auto-GPT的“手”和“感官”,它们相互配合,使得一切井然有序。

alt

向量数据库——当下最为流行的 Memory 增强神器

虽然 Auto-GPT 可以自动执行任务,但它在理解信息和存储上下文方面仍有一定的局限性。

在自主 AI 程序中,为了完成用户设定的目标,必然会产生多个步骤。然而,这些步骤并不能单独发给 GPT 模型,否则将丢失上下文。如果没有上下文,自主程序无法判断当前执行动作是否正确,也就很难向靠近最终的目标。这里的上下文类似于训练模型中的 loss;然而,如果每个步骤都把所有历史消息发送给 GPT 模型,用户设定目标的复杂程度将受到极大的限制。过于复杂的任务必然需要被拆解成更多小步骤进行处理。这会导致自然历史对话变得长,其 token 数量也会增加,使得 token 数量超出 LLM 可处理的范围。

为此,开发者们在 Auto-GPT 中也尝试过两种方案来增强其信息存储和对上下文的理解能力。

其一,使用 LLM 对 Memory 进行 Summary。这是当前 Auto-GPT 正在尝试的一种方案,便于控制 Memory 的规模。其优势不言而喻,即在小规模的情况下可以收获不错的效果,每次传导给大模型的 prompt 概括度会更高。不过,该方案依然会受制于 token 数量,除了成本高昂以外,Auto-GPT 完成的任务复杂度也不会太高。

其二,利用向量数据库来保存 Memory。除了保存记忆,向量数据库也能承担起检索相关 Memory 的角色,流程大致如下:

  • 在每个步骤运行完成时,将 command 信息和执行结果数据进行 embedding 操作,插入向量数据库中;

  • 在进行下一次任务生成、构建 context 时,获取历史窗口中的消息;

  • 将上述历史消息全部作为向量数据库搜索的输入,然后获取 topk 的历史消息。这些 topk 的历史消息相对于之前固定窗口的上下文信息跨度将增加。同时,根据这些相似信息,自主程序将得知之前与当前动作类似的执行结果,这样就可判断之前行为对于完成任务是否有益,从而更加准确地生成下一个 command 的信息。

尽管方案二也存在一定的局限性,不过它仍是当前最为通用的一种方案。

如何将【记忆神器】集成到 Auto-GPT 中?

在最近更新的 Auto-GPT 版本中,Auto-GPT 暂时只支持第一种方案来理解上下文,想要体验向量数据库的小伙伴可以使用一个历史版本进行体验,链接为:【https://github.com/SimFG/Auto-GPT】。

在完成上述准备后,大家就可以使用 Milvus 试水了。

作为全球最受欢迎的开源向量数据库的代表,Milvus 能够处理数百万、数十亿向量的大型数据集。因此,有需求的小伙伴可以按照下述方式将 Milvus 与 Auto-GPT 进行集成。

  1. 拉取 Milvus 的 Docker 镜像并使用 Docker Compose 安装;
https://github.com/milvus-io/milvus/releases/download/v2.2.8/milvus-standalone-docker-compose.yml
docker compose up -d
  1. 在 python 环境中安装 pymilvus 客户端;
pip install pymilvus==2.2.8
  1. 更新 .env 文件。
MEMORY_BACKEND=milvus

当然,如果觉得部署和维护 Milvus 比较麻烦,推荐大家使用 Zilliz Cloud,可以提供开箱即用的向量数据库服务,轻松帮你管理 Auto-GPT 的内存。

Zilliz Cloud 在全球范围内拥有广泛的用户基础,是 OpenAI 指定的 ChatGPT Retrieval 插件提供者。目前已覆盖 AWS、GCP,今年 6 月底即将登陆阿里云,国内其他几朵云也在准备中。

以下是在 Auto-GPT 中使用 Zilliz Cloud 的方法:

  • 登陆或注册 Zilliz Cloud 的账号(https://cloud.zilliz.com/signup),现在注册即可获赠价值 400 的 credits;

  • 创建一个数据库并获取公共云端点;

  • 安装 pymilvus 运行 pip install pymilvus==2.2.8,用下述命令更新 .env 文件:

MEMORY_BACKEND=milvus
MILVUS_ADDR=your-public-cloud-endpoint
MILVUS_USERNAME=your-db-username
MILVUS_PASSWORD=your-db-password

写在最后

不可置否,向量数据库为 Auto-GPT 的结合对于增强 Auto-GPT 的能力至关重要。不过,正如前文所言,这背后存在一定的局限性。例如:

  • 从向量数据库中获取 top-k 消息时没有进行过滤,相似度极低的信息可能会对 GPT 模型产生误导,从而减缓完成预设目标的速度;

  • 上下文数据只能进行添加和查询,加入清理功能会更好;

  • 无法自定义 embedding 模型,目前只能使用 OpenAI 提供的 embedding 接口。

当然,向量数据库和自动化 AI 的结合远不止如此,仍有诸多可能性:

首先,可以想象到的是未来自动化 AI 可能具备自动纠错的能力,在其发现错误后,自动纠错可以通过快照的方式恢复进入错误路线前的记忆。此时,使用向量数据库来为快照恢复以及错误路线提供标记就是一个不错的方案。

其次,当前自动化 AI 的 Memory 结构仍然偏线性,但是现实世界中的复杂业务不太可能被线性地完成,Memory 可能是树状甚至是图状的结构。此时,我们需要整理及存储复杂的 Memory,向量数据库就是一个很好的选择。

再者,存储总是比计算便宜,未来自动化 AI 会产出大量的重复性数据(可能是同一个AI Agent的,也可能是非常多 AI Agent 的重复行为),使用向量数据库作为缓存可以大幅降低成本与提高响应速度。目前,已经有针对响应的解决方案出现,例如 GPTCache(点击了解更多)。

点击获取 Auto-GPT 相关 PPT 和视频讲解。

(本文作者系 Zilliz 软件工程师付邦、叶祯)


  • 如果在使用 Milvus 或 Zilliz 产品有任何问题,可添加小助手微信 “zilliz-tech” 加入交流群。

  • 欢迎关注微信公众号“Zilliz”,了解最新资讯。 alt

本文由 mdnice 多平台发布

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/573315.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

《操作系统》by李治军 | 实验5.pre - switch_to 汇编代码详解

目录 【前言】 一、栈帧的处理 1. 什么是栈帧 2. 为什么要处理栈帧 3. 执行 switch_to 前的内核栈 4. 栈帧处理代码分析 二、PCB 的比较 1. 根据 PCB 判断进程切换与否 2. PCB 比较代码分析 三、PCB 的切换 1. 什么是 PCB 的切换 2. PCB 切换代码分析 四、TSS 内核…

ChatGPT再起争端,如何应对未来的机器挑战?速来学习解决方法!

AI孙燕姿事件 前些日子,“AI孙燕姿”一度火爆出圈。其实就是有网友使用人工智能技术,利用神似歌星孙燕姿的声音翻唱了不少歌手的代表作,并上传到社交平台上,而其翻唱作品的逼真程度是“甚至换气声都可以模仿”。随着“AI孙燕姿”翻…

你还不会AVL树吗?

AVL树 AVL树概念AVL树的插入结点定义插入流程左单旋右单旋左右双旋右左双旋 验证AVL树 AVL树概念 🚀AVL树是一颗平衡的二叉搜索树,所谓平衡是指左右子树的高度差的绝对值不超过1。所以一颗AVL树(如果不是空树)有以下性质&#xf…

2023 年的 Web Worker 项目实践

目录 前言 引入 Web Worker Worker 实践 Worker 到底有多难用 类库调研 有类库加持的 worker 现状 向着舒适无感的 worker 编写前进 1. 抽取依赖,管理编译和更新: 2. 定义公共调用函数,引入所打包的依赖并串联流程: 3. …

两种方法绘制笑脸(需要用到canvas标签)

两种方法绘制笑脸&#xff08;需要用到canvas标签&#xff09; 方法一&#xff1a; <!DOCTYPE html> <html><head lang"en"><meta charset"utf-8"><title>绘制笑脸-方法一</title></head><body><canv…

二开项目权限应用全流程

二开项目-权限应用全流程(人力资源类) addRoutes基本使用** 格式 **router.addRoutes([路由配置对象])**或者:this.$router.addRoutes([路由配置对象]) 改造代码 1 .在router/index.js中的路由配置中删除动态路由的部分 export const constantRoutes [{path: /login,comp…

【ChatGPT】如何入门GPT并快速follow当前的大语言模型LLM进展?

如何入门GPT并快速follow当前的大语言模型LLM进展? 自从去年chatGPT悄悄发布,OpenAI发布的GPT系列工作也变得炙手可热,而基于此,各家公司/实验室百家争鸣,纷纷发布自己的工作,可以说每天都有新的进展。 在当前的情况下,要如何入门GPT系列生成模型,并快速跟进SOTA进展…

SpringMVC一站式学习,分分钟钟让你上手

文章目录 一、SpringMVC1.1 引言1.2 MVC架构1.2.1 概念1.2.2 好处 二、开发流程2.1 导入依赖2.2 配置核心(前端)控制器2.3 后端控制器2.4 配置文件2.5 访问 三、接收请求参数3.1 基本类型参数3.2 实体收参【重点】3.3 数组收参3.4 集合收参 【了解】3.5 路径参数3.6 中文乱码 四…

突破障碍:数字化如何改变对外劳务行业

有没有一份工作是又高薪又能学英语又能环游世界&#xff1f;在小红书上一搜&#xff0c;就发现许多年轻人曾经有过“国际邮轮”工作的经历&#xff0c;打卡全球100城市、全方面的英文口语环境、一觉起来就是一个新的国家...而且还能赚钱&#xff1f;听上去真是令人向往的生活&a…

PoseiSwap 参赛,参与斯坦福、Nautilus Chain等联合主办的 Hackathon 活动

近日&#xff0c;由 Stanford Blockchain Accelerator、Zebec Protocol、 Nautilus Chain、Rootz Lab 共同主办的“ Boundless Hackathon Stanford ” 主题的黑客松活动&#xff0c;目前已接受报名。该活动旨在帮助更多的优质开发者参与到 Web3 世界的发展中&#xff0c;推动链…

自动化测试框架、Python面向对象以及POM设计模型简介

目录 1 自动化测试框架概述 2 自动化测试框架需要的环境 3 自动化测试框架设计思想&#xff1a;Python面向对象 4 自动化测试框架设计思想&#xff1a;POM&#xff08;Page Object Model&#xff09;页面对象模型 1 自动化测试框架概述 所谓的框架其实就是一个解决问题…

如何在华为OD机试中获得满分?Java实现【去除多余空格】一文详解!

✅创作者:陈书予 🎉个人主页:陈书予的个人主页 🍁陈书予的个人社区,欢迎你的加入: 陈书予的社区 🌟专栏地址: Java华为OD机试真题(2022&2023) 文章目录 1. 题目描述2. 输入描述3. 输出描述4. Java算法源码5. 测试6.解题思路1. 题目描述 去除文本多余空格,但不…

MOTOTRBO CPS2.0安装与写频流程

一、安装MOTOTRBO CPS2.0写频软件 安装MOTOTRBO CPS2.0写频软件&#xff0c;选择安装软件的电脑系统必须WIN7以上 1.解压CPS2_2.21.61.0.zip至当前文件内 2. 双击MOTOTRBO_CPS_2.0.exe安装文件 3. 选择安装语言中文&#xff08;简体&#xff09;&#xff0c;点击确定 4.点击下一…

SW质量属性

1. 覆盖质量属性&#xff1a;指派质量、质量中心和惯性张量的值以覆写所计算的值。 2. 质量属性内容&#xff1a; 密度质量体积曲面区域质量中心惯性主轴惯性矩和产品准则 在图形区域中&#xff0c;单色三重轴指示了模型的主轴和质量中心。 三色参考 3D 三重轴将显示在原点 …

Windows10如何快速安装虚拟机! Hyper-V

您可以在 Windows 10 上使用 Hyper-V 来创建虚拟机。Hyper-V 是 Microsoft 提供的虚拟化软件。您可以按照以下步骤在 Windows 10 上安装 Hyper-V 虚拟机&#xff1a; 1. 打开 Hyper-V 管理器&#xff0c;您可以按下 Windows 键并键入 “Hyper-V 管理器”。如果没有Hyper-V这个选…

汇编寄存器认识

1.8086CPU的16个寄存器: 8086CPU所有寄存器都16位: 通用寄存器: 存放一般性数据: 包括 数据寄存器 , 指针寄存器, 索引寄存器 (AX,BX,CX,DX,BP,SP,SI,DI) 数据寄存器: AX,BX,CX,DX AX: AX(Accumulator Register) &#xff1a;累加寄存器&#xff0c;主要用于输入/输出和大…

【JavaSE】Java基础语法(十七)

文章目录 1. final2. 代码块2.1 代码块概述2.2 代码块分类 1. final fianl关键字的作用 final代表最终的意思&#xff0c;可以修饰成员方法&#xff0c;成员变量&#xff0c;类 final修饰类、方法、变量的效果 fianl修饰类&#xff1a;该类不能被继承&#xff08;不能有子类&a…

【EHub_tx1_A200】Ubuntu18.04 + ROS-Melodic/ROS2-Elequent + 速腾 RS-Helios_16P雷达 评测

大家好&#xff0c;我是虎哥&#xff0c;之前使用了很多单线激光雷达&#xff0c;这几年&#xff0c;3D激光雷达国产化后&#xff0c;逐步已经降价很多&#xff0c;3D激光雷达对于大环境导航&#xff0c;无人驾驶辅助导航&#xff0c;都有很多优势。经过逐步的筛选&#xff0c;…

性能测试知多少---性能分析与调优的原理

最近一直纠结性能分析与调优如何下手&#xff0c;先从硬件开始&#xff0c;还是先从代码或数据库。从操作系统&#xff08;CPU调度&#xff0c;内存管理&#xff0c;进程调度&#xff0c;磁盘I/O&#xff09;、网络、协议&#xff08;HTTP&#xff0c; TCP/IP &#xff09;&…

JavaEE——自主实现计时器

文章目录 一、认识定时器二、自主实现定时器1.明确定时器的内核原理2.定时器框架搭建3.优先级队列中的比较问题4.“忙等”问题5. 代码中随机调度的问题 三、整体代码罗列 一、认识定时器 什么是定时器 定时器是我们在日常的软件开发中很重要的一个组件。类似于闹钟&#xff0c…