LLM之Agent（三）：HuggingGPT根据用户需求自动调用Huggingface合适的模型

LLM之Agent（三）：HuggingGPT根据用户需求自动调用Huggingface合适的模型

news2025/2/22 20:26:26

浙大和微软亚洲研究院开源的HuggingGPT，又名JARVIS，它可以根据用户的自然语言描述的需求就可以自动分析需要哪些AI模型，然后去Huggingface上直接调用对应的模型，最终给出用户的解决方案。

一、HuggingGPT的工作流程

它的工作流程包括四个阶段:

任务规划：ChatGPT将用户的需求解析为任务列表，并确定任务之间的执行顺序和资源依赖关系；
模型选择：ChatGPT根据HuggingFace上托管的各专家模型的描述，为任务分配合适的模型；
任务执行：混合端点（包括本地推理和HuggingFace推理）上被选定的专家模型根据任务顺序和依赖关系执行分配的任务，并将执行信息和结果给到ChatGPT；
响应生成：最后，由ChatGPT总结各模型的执行过程日志和推理结果，给出最终的输出。

下表展示了HuggingGPT的具体细节：

不同任务的任务规划评估，如下表所示：

任务规划的格式是： [{"task": task, "id", task_id, "dep": dependency_task_ids, "args": {"text": text, "image": URL, "audio": URL, "video": URL}}]，参数的详细解释，如下表所示：

二、HuggingGPT的示例

假设我们有如下请求，来看一下HuggingGPT的完整流程：

请求：请生成一个女孩正在看书的图片，她的姿势与example.jpg中的男孩相同。然后请用你的声音描述新图片。

可以看到HuggingGPT是如何将它拆解为6个子任务，并分别选定模型执行得到最终结果的。

三、HuggingGPT不同任务的实验效果

参考文献：

[1] https://github.com/microsoft/JARVIS

[2] https://huggingface.co/spaces/microsoft/HuggingGPT

[3] https://arxiv.org/abs/2303.17580

[4] https://twitter.com/DrJimFan/status/1642563455298473986

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1284476.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

Hadoop的介绍与安装

Hadoop的介绍与安装

1　Hadoop的简介 Hadoop是一个开源的大数据框架，是一个分布式计算的解决方案。Hadoop是由java语言编写的，在分布式服务器集群上存储海量数据并运行分布式分析应用的开源框架，其核心部件是HDFS与MapReduce。 HDFS是一个分布式文件系统&#x…

阅读更多...

专业课145+总分440+东南大学920考研专业基础综合信号与系统数字电路经验分享

专业课145+总分440+东南大学920考研专业基础综合信号与系统数字电路经验分享

个人情况简介今年考研440，专业课145，数一140，期间一年努力辛苦付出，就不多表了，考研之路虽然艰难，付出很多，当收获的时候，都是值得，考研还是非常公平，希望大…

阅读更多...

单片机第三季-第四课：STM32下载、MDK和调试器

单片机第三季-第四课：STM32下载、MDK和调试器

目录 1，扩展板使用的STM32芯片类型 2，使用普中科技软件下载程序 3，keil介绍 4，JLINK调试器介绍 5，使用普中的调试器进行debug 6，使用Simulator仿真 1，扩展板使用的STM32芯片类型扩展版…

阅读更多...

【EtherCAT详解】基于Wireshark的EtherCAT帧结构解析

【EtherCAT详解】基于Wireshark的EtherCAT帧结构解析

写在前面 EtherCAT的报文比较繁琐，且一些参考书籍错误较多，且晦涩难懂，对于初学者，很难快速的入门。本文适用于有一定基础的研究者，如对报文有一些研究、对canopen协议有一定了解、并且对TwinCAT有了解的研究者。当然，对于初学者来说，也是很好的引导，少走很多弯路。本…

阅读更多...

图中点的层次（图的BFS）

图中点的层次（图的BFS）

给定一个 n 个点 m 条边的有向图，图中可能存在重边和自环。所有边的长度都是 1，点的编号为 1∼n。请你求出 1 号点到 n 号点的最短距离，如果从 1 号点无法走到 n 号点，输出 −1。输入格式第一行包含两个整数 n 和 m。接…

阅读更多...

Nat easy IP ACL

Nat easy IP ACL

0表示匹配，1表示任意（主机位0.0.0.255（255主机位）） rule deny source 192.168.2.1 0 设置拒绝192.168.2.1的主机通过记住将其应用到接口上 [AR2]acl 2000 //创建基本ACL [AR2-acl-basic-2000]rule deny source 192…

阅读更多...

WordPress发送邮件设置

WordPress发送邮件设置

WordPress在修改登陆邮箱或找回登陆密码的时候，通常都需要发送邮件来进行操作验证，但服务商又禁止了服务器对外发送邮件的25端口，很多虚拟主机本身也禁用了mail函数，根本发不了邮件。此时我们可以使用QQ邮箱、网易邮箱或者其他企…

阅读更多...

Win10安装ROS2遇到的小问题

Win10安装ROS2遇到的小问题

按照网上教程安装ROS2，卡在了第一步。在cmd或powershell安装Chocolatey时，出现以下两种错误： “%SystemRoot%\System32\WindowsPowerShell\v1.0\powershell.exe” -NoPro …~here-string 标题后面和行尾之前不允许包含任何字符。 …… 或者使…

阅读更多...

字符串函数strlen的用法详解及其相关题目

字符串函数strlen的用法详解及其相关题目

strlne函数的使用一.strlen函数的声明二.strlen函数的头文件三.相关题目代码1代码2题目1题目2题目3题目4题目5题目6 一.strlen函数的声明 size_t strlen ( const char * str );二.strlen函数的头文件使用strlen函数我们需要使用以下头文件 #include <string.h>三.相…

阅读更多...

LaTex入门简明教程

LaTex入门简明教程

文章目录写在前面安装Texlive的安装TeXstudio 的安装 LaTex 的使用节指令图指令表指令公式指令参考文献指令引用指令TeXstudio 编译 LaTex 的 \label{} 写法建议最后写在前面这篇文章面向没有任何 LaTex 基础的小白，主要讲解了 LaTex 的安装和使用。读完文章之后…

阅读更多...

SVPWM原理及simulink

SVPWM原理及simulink

关注微♥“电击小子程高兴的MATLAB小屋”获得专属优惠一.SVPWM原理 SPWM常用于变频调速控制系统，经典的SPWM控制主要目的是使变频器的输出电压尽量接近正弦波，并未关注输出的电流波形。而矢量控制的最终目的是得到圆形的旋转磁场，这样就要求…

阅读更多...

大数据项目——基于Django协同过滤算法的房源可视化分析推荐系统的设计与实现

大数据项目——基于Django协同过滤算法的房源可视化分析推荐系统的设计与实现

大数据项目——基于Django协同过滤算法的房源可视化分析推荐系统的设计与实现技术栈：大数据爬虫/机器学习学习算法/数据分析与挖掘/大数据可视化/Django框架/Mysql数据库本项目基于 Django框架开发的房屋可视化分析推荐系统。这个系统结合了大数据爬虫、机器学习…

阅读更多...

SaToken利用Redis做持久化

SaToken利用Redis做持久化

官网解释官网解释教程引入依赖  <dependency><groupId>org.apache.commons</groupId><artifactId>commons-pool2</artifactId> </dependency><!-- Sa-Token 整合 Redis （使用 jdk 默认序…

阅读更多...

Linux--网络编程-ftp（TCP）网络通信-文件交互

Linux--网络编程-ftp（TCP）网络通信-文件交互

项目要求：实现以下内容远程控制： 1、查看服务器当前路径文件 ls 3、进入、退出服务器文件夹 cd 4、上传文件到服务器 put xxx 本地控制： 1、查看本地（客户端）文件 lls 2、进入客户端文件夹 lcd 3、获取服务器的文件…

阅读更多...

【开发PaaS】基于Postgresql的开发平台Supabase

【开发PaaS】基于Postgresql的开发平台Supabase

Supadase是开源的。我们选择可扩展的开源工具，使其易于使用。 Supadase不是Firebase的1对1映射。虽然我们正在构建Firebase提供的许多功能，但我们不会以同样的方式进行： 我们的技术选择大不相同；我们使用的一切都是开源的&#…

阅读更多...

网络安全（二）-- Linux 基本安全防护技术

网络安全（二）-- Linux 基本安全防护技术

4.1. 概述安全防护基础主要是会用Linux系统， 熟悉Linux基本操作命令。在这个章节中，我们主要探讨自主访问控制（许可位、ACL）、文件属性、 PAM技术、能力机制等。 4.1.1. 补充命令本章节中，涉及一些新的命令&#…

阅读更多...

leetcode做题笔记1038. 从二叉搜索树到更大和树

leetcode做题笔记1038. 从二叉搜索树到更大和树

给定一个二叉搜索树 root (BST)，请将它的每个节点的值替换成树中大于或者等于该节点值的所有节点值之和。提醒一下， 二叉搜索树满足下列约束条件： 节点的左子树仅包含键小于节点键的节点。节点的右子树仅包含键大于节点键的节点。左右…

阅读更多...

@PostConstruct使用详解

@PostConstruct使用详解

一、简介在Spring应用程序中启动时，有时需要在所有Bean都已加载，初始化并准备好之后执行某些自定义代码。这时，Spring提供了一个可用的方式，即使用PostConstruct注解。这个注解用于标记一个方法，这个方法将在Bean初始…

阅读更多...

【Cesium】模型平面裁切

【Cesium】模型平面裁切

const scene viewer.scene;let tileset; let targetY 400.0; let planeEntities []; let selectedPlane; // 选择的切面 let clippingPlanes; // 切面属性// 当鼠标点击切面时，修改相关属性 const downHandler new Cesium.ScreenSpaceEventHandler(viewer.sce…

阅读更多...

xampp环境安装

xampp环境安装

XAMPP是完全免费且易于安装的Apache发行版，其中包含Apache、MariaDB、PHP和Perl。类似XAMPP的服务器套件还有很多，我用过的还有UPUPW，它们都极大的简化了开发环境的配置。下载链接Download XAMPP 我选的最新的一路next就安装好了。访问…

阅读更多...

推荐文章

最新文章