香港大学余涛组推出开源XLANG Agent!支持三种Agent模式

news2024/11/27 2:26:52

作者 |小戏、ZenMoore

一个新的未来又逐渐开始从理论走向现实走到我们身边了

语言的意义在于使用,而从 ChatGPT 以来这些大规模语言模型的意义,也必然绝不止于 Chat,在四个月前,我们介绍了清华大学关于工具学习的综述《清华发布工具学习框架,让ChatGPT操控地图、股票查询,贾维斯已来?》,探究如何把以 GPT-4 为代表的大模型更好的与现有的专业工具(如专业设备、程序接口、商业软件等等)相互结合,将大模型变为一个贾维斯式的私人管家而非单纯的聊天机器。

而在四个月前 Demo 式的畅想后,最近香港大学余涛老师组(XLANG Lab)在五个月 15 名研究人员全职投入开发后,推出了一个开源的大模型 Agent——XLANG Agent!

大模型研究测试传送门

GPT-4传送门(免墙,可直接测试,遇浏览器警告点高级/继续访问即可):
Hello, GPT4!

在介绍的博客中,XLANG Agent 的作者将大模型 Agent 可以完成的工作理解为这样一个过程“想象一下这个过程,将以日常语言为载体的人类的指示或问题转化为机器可以理解的动作和代码,随后机器在特定的环境中执行这些动作,从而改变该环境的状态。这些变化被观察、分析,并进而启动与人类下一步交互的循环

事实上,这种大模型 Agent 的理念正是科幻作品中那些遵循人类指令执行特定任务的智能体的初级版本。而 XLANG 则充当着自然语言与特定指令(如可执行的代码或特定动作序列)之间的桥梁,其所互动的环境包括却不限于数据库、Web 应用乃至现实的物理世界。在与环境及人类本身相互不断的一轮轮互动之中,大模型 Agent 可以不断集成人们的反馈到其上下文中,以协作 Agnet 精准有效的完成任务并且延申与拓展用户的真实意图。

具体而言,作者团队将大模型 Agent 总结为:

  • 大模型 Agent 的目标在于在具体环境中解决人类面对的问题,如数据分析、房地产服务等,而非一般的聊天机器人;

  • 大模型 Agent 允许用户以自然语言提供反馈,以指导 Agent 更好的探索并完成任务,换言之,大模型 Agent 可以处理多轮的任务而非单轮的简单输入输出;

  • 大模型 Agent 配备了代码、插件以及浏览器等工具增强其能力,而并不仅仅限于大模型本身。

整个 XLANG Agent 的构建基于 LangChain,LangChain 是一种用于构建由大模型驱动应用程序的框架。基于 LangChain 中的 ReAct,作者团队构建 XLANG Agent 通过三个阶段完成任务:

  • 思考阶段:生成推理轨迹,为下一步行动提供支持;

  • 行动阶段:参与同环境的相互作用;

  • 观察阶段:观察环境状态,为下一步决策做好准备。

在 LangChain 的基础上,XLANG Agent 配备了一套全面的工具、搭建了完整的用户界面,重构了信息表示以及 Prompting。区别于 OpenAI 发布的代码解释器及插件,XLANG Agent 的目标在于构建一个开源通用的大模型 Agent 系统及框架,使得人们可以迭代的添加与改进 Agent 的设计与工作逻辑,集成更多工具,推动大模型 Agent 乃至更宏观的 Executable Language Grounding 的发展

目前,XLANG Agent 支持三种不同的 Agent 场景,分别是数据处理、插件使用以及 Web Agent(Robot Agent 即将推出),其中,数据 Agent 可以让用户在选择特定工具后,主动采取行动满足用户需求,譬如让 Agent 首先为自己寻找股票的数据集:

通过点击式的操作,可以将 Agent 找到的数据集加载到界面的 Files 中:

并且通过简单的指令就可以让 Agent 为自己绘制出可交互的图表

并且可以让 Agent 使用类似 ARIMA 这样的模型对数据进行拟合,可以看到 Agent 有可能会拟合失败:

但是“Try it again”,就可以让 Agent 再次尝试并成功搭建好模型

类似的,插件 Agent 可以利用提供的上百个 API 智能的确定当前环境下应该使用的插件,譬如当我前往多伦多时,插件 Agent 会智能的推荐景点、处理货币的换算、提供天气更新、服装建议等等

Web Agent 则会利用 Chrome 扩展程序自动化网站导航,简化浏览并增强信息检索能力,譬如从 IMDb 提取电影评论等等

目前这三个代理都已经上线,作为 XLANG 开源之旅的开始,作者团队表示在未来几个月以及更久的时间里,将会有包括所有框架、模型、演示、代码以及 Benchmark 被发布,XLANG Agent 的主页、代码及文档如下:

博客题目:
Introducing XLang: An Open-Source Framework for Building Language Model Agents via Executable Language Grounding

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/877571.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

设计师常用的UI设计软件推荐

如今,随着互联网时代设计岗位的演变,近年来出现了一位新兴而受欢迎的专业UI设计师。对于许多对UI设计感兴趣或刚刚接触UI设计的初学者来说,他们不禁想知道,成为一名优秀的UI设计师需要掌握哪些UI软件?今天,…

基于深度信念神经网络+长短期神经网络的降雨量预测,基于dbn-lstm的降雨量预测,dbn原理,lstm原理

目录 背影 DBN神经网络的原理 DBN神经网络的定义 受限玻尔兹曼机(RBM) LSTM原理 DBN-LSTM的降雨量预测 基本结构 主要参数 数据 MATALB代码 结果图 展望 背影 DBN是一种深度学习神经网络,拥有提取特征,非监督学习的能力,通过dbn进行无监督学习提取特征,然后长短期神经…

巨人互动|Facebook企业户哪些是常见的Facebook广告规避系统的原因?

在使用Facebook广告投放时,广告主需要注意广告规避系统,因为这可能会影响他们的广告效果和投放计划。下面,我们将探讨一些常见的Facebook广告规避系统原因,以及如何应对这些问题。 1、过度使用文字 Facebook广告规定&#xff0c…

Opencv 之ORB特征提取与匹配API简介及使用例程

Opencv 之ORB特征提取与匹配API简介及使用例程 ORB因其速度较快常被用于视觉SLAM中的位姿估计、视觉里程、图像处理中的特征提取与匹配及图像拼接等领域本文将详细给出使用例程及实现效果展示 1. API 简介 创建 static Ptr<ORB> cv::ORB::create (int nfeatures 500…

学习笔记整理-面向对象-03-构造函数

一、构造函数 1. 用new调用函数的四步走 new 函数();JS规定&#xff0c;使用new操作符调用函数会进行"四步走"&#xff1a; 函数体内会自动创建出一个空白对象函数的上下文(this)会指向这个对象函数体内的语句会执行函数会自动返回上下文对象&#xff0c;即使函数没…

事件过滤器(eventfilter)的说明与使用

事件过滤器可以在不定义一个新的类的情况下&#xff0c;对界面组件的事件进行处理。事件过滤器通过将一个对象的事件委托给另一个对象来监视并进行处理&#xff1b;如一个窗口可以作为其界面上的QLabel组件的事件过滤器&#xff0c;派发给QLabel组建的事件由窗口去处理&#xf…

Blender 混合现实3D模型制作指南【XR】

本教程分步展示如何&#xff1a; 减少 3D 模型的多边形数量&#xff0c;使其满足 Microsoft Dynamics 365 Guides 和使用 Microsoft Power Apps 创建的应用程序中包含的混合现实组件的特定性能目标的性能需求。将 3D 模型的多种材质&#xff08;颜色&#xff09;组合成可应用于…

matplotlib绘制位置-时序甘特图

文章目录 1 前言2 知识点2.1 matplotlib.pyplot.barh2.2 matplotlib.legend的handles参数 3 代码实现4 绘制效果5 总结参考 1 前言 这篇文章的目的是&#xff0c;总结记录一次使用matplotlib绘制时序甘特图的经历。之所以要绘制这个时序甘特图&#xff0c;是因为22年数模研赛C…

关于consul的下载方法

linux下 sudo yum install -y yum-utils sudo yum-config-manager --add-repo https://rpm.releases.hashicorp.com/RHEL/hashicorp.repo sudo yum -y install consulwindow下 https://developer.hashicorp.com/consul/downloads 然后把里面的exe文件放在gopath下就行了 验证…

手机照片误删怎么办,电脑照片误删怎么办怎么才能找回,EasyRecovery来帮您

手机照片误删怎么办&#xff0c;电脑照片误删怎么办怎么才能找回&#xff0c;EasyRecovery 2023来帮您&#xff01;&#xff01;&#xff01; EasyRecovery 2023是一款操作安全、价格便宜、用户自主操作的 数据恢复 方案&#xff0c;它支持从各种各样的 存储介质 恢复删除 或者…

12 注册登录

12 注册登录 整体概述 使用数据库连接池实现服务器访问数据库的功能&#xff0c;使用POST请求完成注册和登录的校验工作。 本文内容 介绍同步实现注册登录功能&#xff0c;具体涉及到流程图、载入数据库表、提取用户名和密码、注册登录流程与页面跳转的代码实现。 流程图&a…

加了ComponentScan,但是feign接口无法注入的原因

正文 正确的注入 如果发现无法注入&#xff1a;看看启动类Application是否有加入注解&#xff1a;EnableFeignClients(AppConstant.BASE_PACKAGES) 注意&#xff1a;EnableFeignClients和ComponentScan是两个独立的扫描&#xff0c;所以&#xff0c;如果只配置了ComponentSca…

FPGA控制RGB灯WS2812B

文章目录 FPGA控制RGB灯WS2812B1、简介1.1水一水1.2程序完成目标1.3项目工程结构 2、代码3、仿真代码4、结果展示 FPGA控制RGB灯WS2812B 1、简介 1.1水一水 最近在学习WS2812B手册&#xff0c;是一个简单的协议编写&#xff0c;做的时间也算是比较久&#xff0c;相对做出了一…

00-认识C++

2、认识C 2.1、例子 一个简单的C例子 #include <iostream>int main() {using namespace std; //使用名称空间cout << "Com up and C me some time.";cout << endl; //换行符&#xff0c;还可以cout<<"\n";cout <…

【JAVA】集合(Collection、Map)

集合和数组都是容器 数组&#xff1a;类型确定&#xff0c;长度固定&#xff0c;可以存储基本类型和引用类型的数据 集合&#xff1a;类型可以不固定&#xff0c;大小可变&#xff0c;只能存储引用数据类型的数据 Collection单列单列集合&#xff0c;每个元素只包含一个值Ma…

伴随矩阵的特征值跟原矩阵特征值居然有关系!!!附证明

文章目录 论点&#xff1a;A与其伴随矩阵的特征值相乘等于|A|证明证明证明中涉及的相关定理&#xff1a;1.逆矩阵与伴随矩阵的关系2.A可逆时&#xff0c;A的逆矩阵的特征值是原矩阵特征值的倒数 论点&#xff1a;A与其伴随矩阵的特征值相乘等于|A| 证明 证明 证明中涉及的相关…

html css实现爱心

<!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>Document</title><style>/* 爱心 */.lo…

基于Matlab实现小偷体貌识别仿真(附上源码+数据集)

小偷体貌识别是一种应用于安全领域的重要技术&#xff0c;它利用计算机视觉和机器学习的方法&#xff0c;通过对监控视频中的人体特征进行提取和分析&#xff0c;来识别出可能的小偷。在本文中&#xff0c;我们将介绍如何使用Matlab实现小偷体貌识别的仿真。 文章目录 介绍部分…

测牛学堂:软件测试工程师都要懂的软件开发模型总结

软件开发模型之快速原型 之前跟大家介绍了最早期的瀑布模型。今天聊一下快速原型模型。 快速原型&#xff0c;在初步确定用户需求之后&#xff0c;快速构造出一个原型项目&#xff0c;可以跟用户展示软件的功能&#xff0c;用户根据原型进行评审&#xff0c;提出更进一步的细…

JavaWeb-Servlet服务连接器(终)

上一篇文章JavaWeb-Servlet服务连接器&#xff08;三&#xff09;_Alphamilk的博客-CSDN博客 目录 1.ServletContext通信 会话技术Cookie与Session 1.Cookie 2.Session 1.ServletContext通信 概念&#xff1a;代表了整个web应用&#xff0c;用于与服务器实现通信 可以通…