​GPT充当大脑,指挥多个模型协作完成各类任务,通用系统AutoML-GPT来了

news2024/12/21 18:41:23

使用 ChatGPT 实现通用人工智能,思路打开了。

当前,AI 模型虽然已经涉及非常广泛的应用领域,但大部分 AI 模型是为特定任务而设计的,它们往往需要大量的人力来完成正确的模型架构、优化算法和超参数。ChatGPT、GPT-4 爆火之后,人们看到了大型语言模型(LLM)在文本理解、生成、互动、推理等方面的巨大潜力。一些研究者尝试利用 LLM 探索通往通用人工智能(AGI)的新道路。

近期,来自德克萨斯州大学奥斯汀分校的研究者提出一种新思路 —— 开发任务导向型 prompt,利用 LLM 实现训练 pipeline 的自动化,并基于此思路推出新型系统 AutoML-GPT。

论文地址:

https://papers.labml.ai/paper/35151be0eb2011edb95839eec3084ddd

AutoML-GPT 使用 GPT 作为各种 AI 模型之间的桥梁,并用优化过的超参数来动态训练模型。AutoML-GPT 动态地接收来自 Model Card [Mitchell et al., 2019] 和 Data Card [Gebru et al., 2021] 的用户请求,并组成相应的 prompt 段落。最后,AutoML-GPT 借助该 prompt 段落自动进行多项实验,包括处理数据、构建模型架构、调整超参数和预测训练日志。

AutoML-GPT 通过最大限度地利用其强大的 NLP 能力和现有的人工智能模型,解决了各种测试和数据集中复杂的 AI 任务。大量实验和消融研究表明,AutoML-GPT 对许多人工智能任务(包括 CV 任务、NLP 任务)是通用的、有效的。

AutoML-GPT 简介

AutoML-GPT 是一个依赖数据和模型信息来格式化 prompt 输入段落的协作系统。其中,LLM 作为控制器,多个专家模型作为协作的执行者。AutoML-GPT 的工作流程包括四个阶段:数据处理、模型架构设计、超参数调整和训练日志生成。

具体来说,AutoML-GPT 的工作机制如下:

  • 通过 Model Card 和 Data Card 生成固定格式的 prompt 段落

  • 构建训练 pipeline,在选定的数据集和模型架构上处理用户需求

  • 生成性能训练日志并调整超参数

  • 根据自动建议的(auto-suggested)超参数调整模型

输入分解

AutoML-GPT 的第一阶段是让 LLM 接受用户输入。为了提高 LLM 的性能并生成有效的 prompt,该研究对输入 prompt 采用特定的指令。这些指令包括三个部分:Data Card、Model Card、评估指标和附加要求。

如下图 2 所示,Data Card 的关键部分由数据集名称、输入数据集类型(如图像数据或文本数据)、标签空间(如类别或分辨率)和默认评估指标组成。

如下图 3 所示,Model Card 由模型名称、模型结构、模型描述和架构超参数组成。通过提供这些信息,Model Card 能告知 LLM 整个机器学习系统使用了哪些模型,以及用户对模型架构的偏好。

除了 Data Card 和 Model Card,用户还可以选择请求更多的评估基准、评估指标或任何约束。AutoML-GPT 将这些任务规范作为高级指令提供给 LLM,用于相应地分析用户需求。

当有一系列需要处理的任务时,AutoML-GPT 需要为每个任务匹配相应的模型。为了达到这一目标,首先系统需要获得 Model Card 和用户输入中的模型描述。

然后,AutoML-GPT 使用 in-context 任务 - 模型分配机制,动态地为任务分配模型。这种方法通过将模型描述和对用户需求的更好理解结合起来,实现了增量模型(incremental model)访问,并提供了更大的开放性和灵活性。

用预测训练日志调整超参数

AutoML-GPT 根据 Data Card 和 Model Card 设置超参数,并通过生成超参数的训练日志来预测性能。该系统自动进行训练并返回训练日志。在数据集上的模型性能训练日志记录了训练过程中收集的各种指标和信息,这有助于了解模型训练进展,找出潜在问题,以及评估所选架构、超参数和优化方法的有效性。

实验

为了评估 AutoML-GPT 的性能,该研究使用 ChatGPT(OpenAI 的 GPT-4 版本)来实现它,并进行多项实验从多个角度展示了 AutoML-GPT 的效果。

下图 4 展示了使用 AutoML-GPT 在未知数据集上训练的结果:

下图 5 展示了 AutoML-GPT 在 COCO 数据集上完成目标检测任务的过程:

下图 6 展示了 AutoML-GPT 在 NQ 开放数据集(Natural Questions Open dataset,[Kwiatkowski et al., 2019])上的实验结果:

该研究还使用 XGBoost 在 UCI Adult 数据集 [Dua and Graff, 2017] 上评估了 AutoML-GPT,以探究其在分类任务上的性能,实验结果如下图 7 所示:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/544046.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

ST典型碳化硅MOSFET驱动应用方案

ST典型碳化硅MOSFET驱动应用方案 1.栅极驱动器规格和功能实现 参考资料:ST官网应用手册《AN4671》 作者:Xiou 1.栅极驱动器规格和功能实现 以下是对栅极驱动要求的简短列表: dv / dt 的瞬变抗扰度:在整个温度范围内 50 V/ns。 …

超级简单的开源saas后台系统管理框架Vite+Vue3

大家好,今天我给大家带来一款超简saas后台管理系统框架,他是一款快速开发SAAS通用管理系统后台框架,前端采用最新的技术栈ViteTypeScriptVue3ElementPlus最流行技术架构,后台结合PHP8、Java SDK、Python等主流后端语言搭建&#x…

黑盒测试方法: 从原理到实战

文章目录 一. 如何设计测试用例二. 常用黑盒测试方法1. 基于需求设计的测试用例2. 等价类划分法3. 边界值4. 判定表分析法 (因果分析法)5. 正交排列6. 场景设计法7. 用例场景示例8. 错误猜测法 三. 补充案例Fiddler实现弱网测试水杯测试用例微信朋友圈测试用例淘宝购物车测试用…

ESP8266连接 TLink 云平台

1.硬件准备 (1)正点原子 ATK-ESP-01 WIFI 模块 (2)正点原子 STM32F103ZET6精英板子 (3)USB转TTL模块 2.烧录固件 (1)烧录软件和固件都可以在正点原子增值资料包找到。 (2…

网络安全基础--dns劫持及IP信息收集

0x01 验证是否存在CDN 方法1: 很简单,使用各种多地 ping 的服务,查看对应 IP 地址是否唯一,如果不唯一多半是使用了CDN, 多地 Ping 网站有:多个地点Ping服务器,网站测速 - 站长工具网站测速工具_超级ping…

创建python虚拟环境的两种方法

创建python虚拟环境的两种方法 一、anaconda环境下1、检查是否安装了anaconda2、创建虚拟环境3、激活虚拟环境4、其他命令 二、python纯净环境下1. 安装virtualenv2. 创建虚拟环境3. 激活虚拟环境 一、anaconda环境下 1、检查是否安装了anaconda 只有在anaconda环境下才能创建…

近百个最新免费chatgpt访问集合,包含国内直接访问和国外升级版本

近百个最新免费chatgpt访问集合,包含国内直接访问和国外升级版本。 ChatGPT是一个基于人工智能的聊天机器人,它可以与用户进行自然语言交互。ChatGPT使用了最新的自然语言处理技术,包括深度学习和神经网络,以便更好地理解用户的…

慎投,5月有4本SCIE期刊被剔除(附SCI/SSCI目录下载)

2023年5月SCI、SSCI期刊目录更新 2023年5月18日,科睿唯安更新了WOS期刊目录,继上次4月WOS期刊目录剔除8本SCIE&SSCI期刊之后,此次5月更新又有4本SCIE期刊发生变动,其中有1本期刊被踢出SCIE数据库,3本期刊更改了名…

pdf怎么转换成ppt文件,5种方法任你选

pdf怎么转换成ppt文件?想必这是我们办公过程中非常常见的问题吧。众所周知,PDF文件格式通常用于存储文档,其内容可能是图像、文字或表格,展示在一个页面上。PPT文件格式通常用于创建演示文稿,其中每个页面都是幻灯片&a…

探秘音乐疗法——基于音乐的喂养环境对小鼠肠道菌群影响的研究

音乐对身心的影响 近年来,环境和动物生理及心理的相关研究越来越多。环境因素的丰富性和多样性是改善动物生理和心理状态的重要研究参数。 环境因素指的是正常环境,在这种环境中,动物通过获得环境激励以做出有益的增强,使它们能够…

怎么把两个pdf合并成一个?三种合并方法任你选择

PDF 格式是一种常见的跨平台文件格式,因此在日常生活和工作中,我们可能需要处理或编辑多个 PDF 文件,并将它们合并为一个文件,以方便查阅和共享。因此,将两个PDF文件合并是非常重要的。首先,两个PDF合并成一…

2023年最新整理渗透测试面试题

1、include、include_once、require、 require_once区别 参考答案: 1、require()和require_once()函数: (1)require()函数引入文件不存在时,将立即退出程序,不再向下执行。 (2)…

AD16中如何创建新工作空间

1、双击“DXP.exe” 如果默认安装,DXP.exe文件位于“C:\Program Files (x86)\Altium\AD16”目录下。 2、打开AD后,我们会看到默认工作空间为“Workspace1.DsnWrk” 3、在“F盘”下创建一个文件夹。命名为“AD16学习”。 4、点击“File-Save Design Work…

Git宝典

版本管理工具介绍 现在比较流行的版本管理工具是git,但是实际上git是近几年才发展起来的,可能有一些老的项目,还在用一些老的软件,如svn 版本管理发展简史 SVN(SubVersion) 工作流程 SVN是集中式版本控…

ClickHouse介绍_安装_准备工作_单机安装---大数据之ClickHouse数据库002

首先要修改一下centos的一些限制,这里是文件数的限制,还有进程的限制 要关闭selinux要关闭防火墙 可以看到执行ulimit -a 可以看到linux系统的一些限制 我们要修改的是上面标注的两个配置,一个是文件数,一个是进程数 去编辑这个文件去修改配置 添加上,这些配置 * soft nofile…

京东商品详情API调用说明 京东商品库存销量接口

尊敬的开发人员: 感谢您选择使用京东API进行开发。下面为您提供一份简要的API调用说明,帮助您快速上手并实现所需功能。 1.注册京东开放平台账户并创建应用 首先,您需要在 https://o0b.cn/jennif/ 网站上注册一个京东开放平台的账户&#…

mybatis的一级二级缓存详解及源码解剖

文章目录 什么是一级缓存?什么是二级缓存?一级缓存二级缓存有什么不同?执行流程源码流程解剖一级缓存失效场景分析二级缓存结构及需要解决的问题二级缓存执行流程二级缓存获取和commit源码解剖总结 什么是一级缓存? 一级缓存是指…

如何把ipa文件(iOS安装包)安装到iPhone手机上? 附方法汇总

苹果APP安装包ipa如何安装在手机上?很多人不知道怎么把ipa文件安装到手机上,这里就整理了苹果APP安装到iOS设备上的方式,仅供参考 苹果APP安装包ipa如何安装在手机上?使用过苹果手机的人应该深有感触,那就是苹果APP安…

opencv 裁剪超大 tif 图像制作深度学习数据集

文章目录 1. 尝试暴力裁剪(24 位)2. 带透明度读取 (32 位)3. 裁剪标签(8 位) 本文只是进行了简单的尝试,未单独处理最右侧、最下侧和右下角区域,且未设置重叠率 若使用 gdal 进行 ti…

【1】Numpy基础

1 N维数组对象(ndarray) 先理解如何通过numpy进行批次计算: 引入numpy,随机生成数组: import numpy as npdatanp.random.randn(2,3) print(data) print(data*10) print(datadata)[[ 0.88001557 -0.70682337 0.81193…