炸裂!Hugging Face 发布重磅更新,人手一个 AutoGPT!

news2024/10/5 14:18:54

公众号关注 “GitHubDaily”

设为 “星标”,每天带你逛 GitHub!

983cc94bc1cb316706715f788d3c46af.jpeg

Hugging Face,作为 AI 开源圈最为知名的「网红」创业公司,成立仅几年,便在 GitHub 开源了诸多实用开源项目,受到了不少开发者的赞赏。

其中影响力最大的,也被很多人称为初代 GPT 的 Transformers,截至今天,GitHub Star 累积将近 10 万。

这几年,在 Hugging Face 平台上面诞生了无数实用的 AI 预训练模型、数据集。数量之多,品质之高,将其说是 AI 界的 GitHub 也不为过。

今天凌晨,Hugging Face 重磅推出 Transformers Agents,在 AI 技术圈再次掀起波澜!

所有人都可以基于该功能,轻松使用 OpenAssistant、StarCoder、OpenAI 等大语言模型,快速创建一个 AI 智能代理。

9d958d9f556ca6e994b7a9809ae911a5.png

官方文档:https://huggingface.co/docs/transformers/transformers_agents

Transformers Agents 里面提供了诸多实用的工具,包括目前 AI 技术应用广泛的文档问答、文本转语音、文本生成图像、网站内容总结、图像分割等一系列工具。

开发者只需完成工具链组装,即可实现许多强大的功能。

比如,你可以通过它,快速实现这么一个功能:

用脚本根据链接,自动抓取某篇文章内容,并生成摘要,再将其翻译成任意一种语言,让 AI 朗读稿件,有需要的话,你还可以让代理为你生成一张配图。

一个基于 AI 能力,可快速报道各种新鲜资讯的播客系统,便能横空出世!

0b726ce8a05c10c4e0c9f652bff69177.jpeg

此外,该代理还支持图像转文本功能,你可以通过给定一张图像,让 AI 读取图像信息,甚至可以大批量为图像自动生成文本,方便后续检索。

这个功能调用有多简单,在你安装完代理之后,一条命令即可搞定:

agent.run("Caption the following image", image=image)

比如,你提供给它一张海狸图像,AI 便能快速生成标题。

15f28354fb8c53db1d58eeff16d99351.png

不仅如此,该代理还可以接受更为复杂的查询方式,通过对话,就能让 AI 实现文字生成图像、网站摘要朗读、PDF 总结等功能。

具体实现,可围绕一系列提示词进行构建,流程如下:

9a9f0062b0d4710e0fa5cba5ff47f5b2.png

  • 明确告知代理的主要任务;

  • 给代理一个工具;

  • 向代理展示示例;

  • 分配任务,让代理通过思维连推理与理解任务,并输出 Python 代码。

除了上面提到的功能,Transformers Agents 还内置了以下这些实用工具:

  • 文档问答功能;

  • 语音转文本、文本转语音;

  • 文本功能(分类、摘要、翻译、下载、问答);

  • 图像功能(生成、转换、字幕、分割、放大、问答);

  • 基于文本直接生成视频,扩展性强。

我们可以通过这些工具,轻松搭配,实现一款可以灵活定制的 AutoGPT,人手一个 AI 智能代理,在不同行业挖掘更多丰富的应用场景。

Hugging Face 对此代理的安装使用也提供了详细文档,不过由于每个人电脑配置不同,这里我建议大家用 Google Colab 进行尝试。

下面跟大家讲下具体使用方式。

安装 & 使用

首先,打开 Hugging Face 提供的 Colab 地址:

https://colab.research.google.com/drive/1c7MHD-T1forUPGcC_jlwsIptOzpG3hSj

你能看到如下所示界面:

3e40fa0a149732c0f16af82f165cd6b1.png

点击「播放」按钮,运行设置,可以看到 Transformers 指定了 v4.29.0 的最新版本,因为目前这个 Agents API,还在实验阶段,所以只在新版本提供支持:

97ed057e13c3c574a1379cbf500a719c.png

等待一两分钟后,它便会弹出输入框。我们需要在这里填入 Hugging Face 提供的 Token。

Token 可到这个地址生成:https://huggingface.co/settings/tokens

填写完成后,点击「Login」登录。

b23d5caa74d720aecabeab90f493dbcb.png

然后再执行下一步,运行并初始化一个 Agent:

0fece7f9fa0eebe3b0fa8d4d946521ce.png

运行完成,会生成一个输入框,在这里填写 OpenAI 的 API Key。

API Key 可在这里生成:https://platform.openai.com/account/api-keys

输入完成后,按下回车键,让代码读取 API Key:

c89885bcc757da564e672392fa59ad7a.png

当你看到提示「OpenAI is initialized 💪」时,表示代理的初始工作已经完成。

你可以在该 Colab 中,体验 Transformers Agents 的各项功能。

比如,最常见的,基于文本生成图像。让代理给我们生成一张漂浮在水面上的船:

agent.run("Generate an image of a boat in the water")

它便会遵循 Prompt 指令,开始自动生成图像:

da3343ee513da4407c0af2c6a8311417.png

Hugging 官方在 Colab 中给出了不少示例,包括为图像生成标题、根据文本生成语音、用对话模式跟图像交流等等,有时间的话,大家也可以逐个试玩一下。

写在最后

之前 AutoGPT 大火,很多人尝试用它来分析金融数据、自动编写爬虫脚本、抓取数据做市场调研、生成可视化报告等等。

但是,由于 AutoGPT 做的是一个通用性实验方案,因此很多东西在定制性上比较差,这就导致脚本在实际运行中,会出现很多不可控因素。

比如,脚本会自动给你生成一堆乱七八糟的文件,跑了半天还是没抓到重点,每次运行都需要重新再来一遍,内容产出性价比很低等等。

如果你稍微懂点开发,未来利用 Transformers Agents 就能搭建一个专属的 AI 智能助理,让它帮你完成各种不同领域的特定工作。

这样无疑会减少很多 Token 消耗,任务执行的准确度与生产质量也会再上一层。

正如我之前所说,随着各项 AI 技术的成熟与进步,在圈内会出现越来越多的解决方案,很多工具也将变得越来越好用。基于此,我们搭建项目的成本也越来越低。

工欲善其事必先利其器,一个称手的工具,能够减少我们很多工作量,大幅提升生产力。

如果你想了解更多实用的 AI 技术与应用,以及 ChatGPT 新进展,可以点击下方链接,加入我们社群进一步交流探讨。

👇 每个进群的人,都会收到我们赠送的一枚 ChatGPT 账号。

社群入口:ChatGPT 社群,正式上线!

不想错过文章推送?可以给 GitHubDaily 公众号加个星标。

1e33764f2f38ed59cf148e6592c21bfd.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/516275.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

中小学智慧校园平台电子班牌系统源码的应用

智慧校园云平台电子班牌系统源码 智慧班牌系统是专门为学校打造的智能信息展示平台,为学校、教师、学生、家长创造一个学习成长交流的共享平台。主要用于显示班级信息、 班级风采、校园文化、课程表、校园活动通知、家校互联等。以图片、音视频、文字、动画、文档等…

【ADS867x】14 位 500kSPS 4/8 通道 ADC 简介及驱动应用示例

器件特性 具有集成模拟前端的 14 位模数转换器 (ADC)具有自动和手动扫描功能的 4 通道、8 通道多路复用器通道独立可编程输入: 10.24V、5.12V、2.56V、1.28V、0.64V10.24V、5.12V、2.56V、1.28V 5V 模拟电源:1.65V 到 5V I/O 电源恒定的阻性输入阻抗&am…

Android 14 快速适配要点

随着 Google I/O 2023 发布的 Android beta2 ,预计 Android 14 将在2023年第三季度发布,目前看整体需要适配的内容已经趋向稳定,那就根据官方文档简单做个适配要点总结吧。 如何做到最优雅的版本适配?那就是尽可能提高 minitSdkVe…

详细版易学版TypeScript - 类型声明:字符串数字null布尔undefined数组any对象void类型推断联合类型

根据官方 TypeScript 的注意事项,建议不要使用 Number、String、Boolean、Symbol 或 Object。 ts各类型声明的代码如下: 一、字符串类型 let str: string hello; str ts; 二、数字类型 let num: number 123; num 456; 三、布尔类型 let flag: boolea…

C语言实现队列--数据结构

😶‍🌫️Take your time ! 😶‍🌫️ 💥个人主页:🔥🔥🔥大魔王🔥🔥🔥 💥代码仓库:🔥🔥魔…

No.065<软考>《(高项)备考大全》【专项3】《论文》

《论文》 1 论文部分相关1.1 考试相关1.2 考试核心相关1.3 历年考试分析1.4 复习建议1.5 评分标准1.5.1 评分的几个方面1.5.2 不及格的几种类型1.5.3 扣分项1.5.4 加分项 1.6 时间进度安排1.7 如何准备 2 必背核心知识 - 10大领域47个过程3 论文写作技巧3.1 论文架构3.2 论文题…

SpringBoot——引导类的简单介绍

简单介绍: 之前我们就说到过引导类,之不过当时就是简单的说了一下这个名字,让大家记住我们运行的程序的学名叫做引导类,但是我们并没有进入看过,介绍过它的作用,这次我们就来简单的介绍一下这个类的作用。…

[NLP] SentenceTransformers使用介绍

SentenceTransformers 是一个可以用于句子、文本和图像嵌入的Python库。 可以为 100 多种语言计算文本的嵌入并且可以轻松地将它们用于语义文本相似性、语义搜索和同义词挖掘等常见任务。 该框架基于 PyTorch 和 Transformers,并提供了大量针对各种任务的预训练模型…

STEP7-MicroWin SMART中修改变量注释的具体方法(绝对寻址+符号寻址)

STEP7-MicroWin SMART中修改变量注释的具体方法(绝对寻址+符号寻址) 如下图所示,我们可以在符号表中定义变量的符号名称以及注释信息, 使用时需注意以下事项: 1.在 STEP 7-Micro/WIN SMART 软件中,可以建立多个符号表,但不允许将相同的符号名多次用作全局符号赋值,在单…

1707_Python中的多成员处理

全部学习汇总: GreyZhang/python_basic: My learning notes about python. (github.com) 欢迎路过的YUAN类朋友们,希望我们能够相互交流共同成长。如有错误或者不足希望及时指点指出,不胜感激!以下是我的联系方式: E…

Kali-linux识别活跃的主机

尝试渗透测试之前,必须先识别在这个目标网络内活跃的主机。在一个目标网络内,最简单的方法将是执行ping命令。当然,它可能被一个主机拒绝,也可能被接收。本节将介绍使用Nmap工具识别活跃的主机。 网络映射器工具Nmap Nmap是一个…

JavaScript经典教程(七)-- JavaScript中级

197:in、预解析、变量提升、对象引用、Date对象 1、预解析 即,把var的变量在,作用域下,提前; (1)JS代码运行原理 预先解析,JS第一次解析代码叫预解析。 JS本身会解析两次代码&a…

vue非单文件组件

非单文件组件指的是:一个文件中包含了多个组件。 Vue 中使用组件的三大步骤:1. 创建组件、2. 注册组件、3. 使用组件。 组件使用流程【第一步:创建组件】 利用 Vue.extend() 方法创建组件: // 第一步:创建 frameHead 组件 cons…

前端015_标签模块_删除功能

标签模块_删除功能 1、需求分析2、EasyMock 添加模拟接口3、Api 调用接口4、测试1、需求分析 当点击删除按钮后, 弹出提示框。点击确定后,执行删除并刷新列表数据 确认消息弹框参考:https://element.eleme.cn/#/zh-CN/component/message-box#que-ren-xiao-xi 2、EasyMock …

【AUTOSAR】【以太网】TCPIP

目录 一、概述 二、约束和假设 三、依赖模块 3.1 EthIf 3.2 EthSM 3.3 SoAd 3.4 KeyM 3.5 CSM 四、功能说明 4.1 系统扩展性 4.2 IPv4 4.2.1 IPv4 4.2.2 ARP 4.2.3 Auto-IP 4.2.4 ICMP 4.3 IPv6 4.4 IPSec 4.5 基于IP的协议 4.5.1 本地地址表 4.5.2 UDP 4…

音视频八股文(12)-- ffmpeg 音频重采样

1重采样 1.1 什么是重采样 所谓的重采样,就是改变⾳频的采样率、sample format、声道数等参数,使之按照我们期望的参数输出。 1.2 为什么要重采样 为什么要重采样?当然是原有的⾳频参数不满⾜我们的需求,⽐如在FFmpeg解码⾳频…

【C++初阶】类和对象(四)

​ ​📝个人主页:Sherry的成长之路 🏠学习社区:Sherry的成长之路(个人社区) 📖专栏链接:C初阶 🎯长路漫漫浩浩,万事皆有期待 上一篇博客:【C初阶】…

(二)zookeeper实战——zookeeper集群搭建

前言 本节内容我们主要介绍一下如何在centos系统下搭建一套高可用的zookeeper集群,zookeeper是我们常用的中间键之一,例如使用zookeeper实现分布式锁、Hadoop集群高可用、kafka集群高可用等等。我们以以下三台服务器为例: zookeeper服务器 I…

R语言tidyverse教程:ggplot2绘图初步

文章目录 基本流程渲染美化坐标轴设置 R语言系列: 编程基础💎循环语句💎向量、矩阵和数组💎列表、数据帧排序函数💎apply系列函数tidyverse:readr💎tibble 基本流程 ggplot2有其独特的绘图语…

【算法题】LCP 74. 最强祝福力场

插: 前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到网站。 坚持不懈,越努力越幸运,大家一起学习鸭~~~ 题目: 小扣在探索丛林的过程中&#xff0…