翻译: LLM工具使用和代理Tool use and agents

news2024/11/13 8:58:40

在这里插入图片描述
欢迎来到本周的最后一个视频。在这个视频中,我想与您分享LLM(大型语言模型)开始能够使用工具的情况,以及讨论一下前沿的“代理”主题,这是让LLM自己决定下一步采取什么行动的领域。让我们来看看。在早期的食物订单接收聊天机器人示例中,我们看到如果您说“给我送个汉堡”,机器人可能回复“好的,正在路上”。

为了让聊天机器人输入订单并将其发送给您,这是幕后实际发生的事情。LLM不能仅仅说“好的,正在路上”,因为它需要采取一些行动来真正将汉堡送到您手中。因此,LLM可能会输出这样的回应:“为用户9876订购汉堡,送到这个地址”,然后还说用户消息是“好的,正在路上”。经过微调的LLM能够生成这样的订单,这种情况下将触发一个软件应用程序,向餐厅订购系统发出请求,将汉堡送到该用户的地址。用户看到的不是完整的LLM输出。这里的完整LLM输出是全部四行文本,但只有最后一行“好的,正在路上”被发送给用户作为回应。所以,这是LLM使用的工具的一个例子,其中LLM输出的文本可以触发调用软件系统来下达餐厅订单。

在这里插入图片描述
现在,下达错误订单可能是一个代价高昂的错误。因此,可能更好的用户界面是,在最终确定订单之前弹出一个验证对话框,让用户确认订单是否正确,然后在扣款并发送给他们之前再次确认。显然,鉴于LLM的输出并不完全可靠,对于任何安全关键或任务关键的操作,在让LLM自行触发可能造成代价高昂的错误之前,让用户确认所需操作是一个好主意。
在这里插入图片描述

除了用于采取行动的工具外,工具还可用于推理。例如,如果您提示LLM,“如果我将100美元存入银行账户,该账户支付5%的利息,那么8年后我将获得多少钱?”LLM可能会生成像这样的答案,听起来似乎是合理的,但147.74美元并不是正确的答案。事实证明,LLM在经过预测下一个词或指令调整的学习后,并不擅长精确计算。就像UI可能会使用计算器来计算类似问题的正确答案一样,我们也可以给LLM一个计算器工具来帮助它得到正确的答案。
在这里插入图片描述

因此,与其让LLM直接输出答案,不如让LLM输出这样的内容:“复利计算后等于,计算器计算100乘以1.05(即5%的利率)的8次方。”这可以解释为命令,调用外部计算器程序来明确计算正确的答案,即147.74美元,并将其反馈到文本中,以便为用户提供正确的金额。通过给LLM提供调用工具的能力,我们可以显著扩展LLM的推理或采取行动的能力。

工具的使用今天是许多LLM应用的重要部分,当然,这些应用的设计者应该小心确保工具不会以可能造成伤害或不可逆转的损害的方式被触发。
在这里插入图片描述

除了工具之外,进入更多实验性领域,AI研究人员一直在研究代理(agents),它们不仅仅触发工具来执行单一动作,而是探索是否可以选择并执行复杂的动作序列。关于代理的研究充满了兴奋和挑战,但这仍处于AI研究的前沿。它还不够成熟,不能用于大多数重要应用。但我想与您分享许多AI社区成员所兴奋的事情。如果您要求一个基于LLM构建的代理帮助您研究更好的汉堡店的主要竞争对手,那么代理可能会使用LLM作为推理引擎,来确定它需要执行哪些步骤来完成您的研究任务。

  1. 这个推理引擎LLM可能会决定需要搜索竞争对手的名单,
  2. 然后访问每个竞争对手的网站,
  3. 最后,针对每个竞争对手,根据主页内容撰写摘要。

然后,通过对这个推理引擎的一系列调用,它可能会发现为了搜索主要竞争对手,它必须触发工具来调用网络搜索引擎,并查询“BetterBurger的竞争对手”。之后,它可能会访问一些主要竞争对手的网站来下载他们的主页。然后再次调用LLM来总结他们在网站上找到的文本。

虽然互联网上已经有一些不错的代理演示,但这项技术还没有真正准备好进入主流应用。但也许在未来,随着研究人员使其变得更好,它将变得更有用。如果LLM作为推理引擎可以帮助决定采取哪些安全和负责任的步骤来帮助用户完成任务,我认为这将是一个令人兴奋的未来。

感谢您坚持观看至第二周的最后。我们的课程还有最后一周。下周,我们将探讨生成型AI如何影响公司,包括您如何为您的业务提出生成型AI用例,以及探讨生成型AI如何影响社会及其对就业的影响。期待下周与您相见。

参考

https://www.coursera.org/learn/generative-ai-for-everyone/lecture/pOwXb/tool-use-and-agents-optional

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1316960.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

centos7安装node-v18版本

背景# 背景就是上一篇文章提到的,部署gitbook这个文档中心的话,是需要先安装node,然后,如果你的node版本过高的话,一般会报错,此时,网上很多文章就是降node版本解决,但其实用高版本…

【️如何理解面向对象和面向过程】

✅如何理解面向对象和面向过程? 典型理解✅扩展知识仓✅面向对象的三大基本特征✅封装✅继承✅多态 ✅为什么Java不支持多继承?✅菱形继承问题✅Java 8 中的多继承 ✅面向对象的五大基本原则? 典型理解 面向过程把问题分解成一个一个步骤&…

buuctf-Misc 题目解答分解85-87

85.[UTCTF2020]file header 下载完就是一个图片 ,但是显示图片错误,提示文件头 没有 用010editor 打开 找一个png 文件,看一下它的头部 只需要修改前四个字节为 89 50 4E 47 即可 就能拿到flag utflag{3lit3_h4ck3r} 86.[WUSTCTF2020]gir…

蓝桥杯专题-真题版含答案-【三角螺旋阵】【干支记年法】【异或加密法】【金字塔】

Unity3D特效百例案例项目实战源码Android-Unity实战问题汇总游戏脚本-辅助自动化Android控件全解手册再战Android系列Scratch编程案例软考全系列Unity3D学习专栏蓝桥系列ChatGPT和AIGC 👉关于作者 专注于Android/Unity和各种游戏开发技巧,以及各种资源分…

v851s ssh搭建与使用

ssh 概述: 1. 用来远程登录的一种安全通道协议(常用于linux 、UNIX中); 2. 分为服务端和客户端: 1)服务端即openSSH ,一般属于目标开发板(linux中配置文件路径/etc/ssh/sshd_config); 2)客户端即登录端,常用工具:sercureCRT 、MobaXterm 、Putty等; 1. ssh 服务…

Webrtc 学习交流

花了几周的时间研究了一下webrtc ,并开发了一个小项目,用来点对点私密聊天 交流传输文件等…后续会继续扩展其功能。 体验地址,大狗子的ID,我在线时可以连接测试到我 f3e0d6d0-cfd7-44a4-b333-e82c821cd927 项目特点 除了交换信令与stun 没…

Hadoop分布式配置小白篇(附加各阶段问题解决方式)

看的黑马的课,记录一下配置步骤 目录 1.VMware安装: 方法1: 方法2: 2.创建虚拟机 1.ISO镜像文件获取(CentOS): 2.创建(简略步骤) 3.克隆虚拟机(克隆伪…

Flutter在Android Studio上创建项目与构建模式

一、安装插件 1、前提条件,安装配置好Android Studio环境 2、安装Flutter和Dart插件 Linux或者Windows平台: 1)、打开File > Settings。 2)、在左侧列表中,选择"Plugins"右侧上方面板选中 "Market…

向华为学习:基于BLM模型的战略规划研讨会实操的详细说明,含研讨表单(二)

上一篇文章,华研荟结合自己的经验和实践,详细介绍了基于BLM模型的战略规划研讨会的设计和组织流程,提高效率的做法。有朋友和我私信沟通说,其实这个流程不单单适合于BLM模型的战略规划研讨会,实际上,使用其…

【C++11特性篇】C++11中新增的initializer_list——初始化的小利器(2)

前言 大家好吖,欢迎来到 YY 滴C11系列 ,热烈欢迎! 本章主要内容面向接触过C的老铁 主要内容含: 欢迎订阅 YY滴C专栏!更多干货持续更新!以下是传送门! 目录 一.探究std::initializer_list是什么…

【MyBatis-Plus】MyBatis进阶使用

目录 一、MyBatis-Plus简介 1.1 介绍 1.2 优点 1.3 结构 二、MyBatis-Plus基本使用 2.1 配置 2.2 代码生成 2.3 CRUD接口测试 三、MyBatis-Plus策略详解 3.1 主键生成策略 3.2 雪花ID生成器 3.3 字段自动填充策略 3.4 逻辑删除 四、MyBatis-Plus插件使用 4.1 乐…

【笔试强化】Day 4

文章目录 一、单选1.2.3.4.5.6.7. 二、不定项选择1.2.3. 三、编程1. 计算糖果题解:代码: 2. 进制转换题解:代码: 一、单选 1. 正确答案:D队列先进先出 A:栈有关 B:错 C:错 2. 正确…

Linux centos7安装redis 6.2.14 gz并且使用systemctl为开机自启动 / 彻底删除 redis

1.下载 && 减压 wget http://download.redis.io/releases/redis-6.2.14.tar.gz tar -zvxf redis-6.2.14.tar.gz 2.编译(分开运行) cd redis-6.2.14 make cd src make install 安装目录展示 3.redis.conf 配置更改 daemonize yes supervised s…

轻量封装WebGPU渲染系统示例<48>- 多种光源的多种组合(源码)

实现方式: 1. 全局的灯光和阴影。 2. 球体和矩形平面使用了相同的材质对象。 3. 通过材质自动关联和组装对应的渲染材质功能节点。 当前示例源码github地址: https://github.com/vilyLei/voxwebgpu/blob/feature/material/src/voxgpu/sample/MultiLightsShading2.ts 当前…

python 连接SQL server 请用pymssql连接,千万别用pyodbc

pymssql官方介绍文档 python 使用 pymssql连接 SQL server 代码示例: 安装pymssql包: pip install pymssql代码: import pymssqldef conn_sqlserver_demo():# 连接字符串示例(根据您的配置进行修改)conn Nonetry:co…

【C++】 C++11 新特性探索:decltype 和 auto

▒ 目录 ▒ 🛫 问题描述环境 1️⃣ decltype推导变量类型推导函数返回类型 2️⃣ auto自动推导变量类型迭代器和范围循环 3️⃣ decltype 和 auto 同时使用🛬 结论📖 参考资料 🛫 问题 描述 C11 引入了一些强大的新特性&#xff…

探索 HBase GUI 工具,助您轻松驾驭大数据世界!

你是否曾为 HBase 数据管理而苦恼?别担心,这一款超级好用的 HBase GUI (HBase Assistant)工具,让您在大数据世界中游刃有余。不再需要繁琐的命令行操作,也不再为复杂的配置感到头疼。 主要功能 直观和设计…

AttributeError: module ‘edge_tts‘ has no attribute ‘Communicate‘解决方案

大家好,我是爱编程的喵喵。双985硕士毕业,现担任全栈工程师一职,热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的…

插入排序:直接插入排序 希尔排序

插入排序: 假设红竖线前的元素全部排好序,红线后面的数即为要插入的数据,红线依次往后移,假设end为排好序的最后一个数字,end1即为要插入的数字,一次插入时,end与要插入的数字依次比较&#xf…

自定义时间选择器

自定义时间选择器 文章目录 自定义时间选择器第一章 效果演示第01节 效果图第02节 主要文件 第二章 案例代码第01节 核心文件 WheelPicker第02节 实体类 WheelBean第03节 接口类 IWheelPicker第04节 原子时间类 DateTimePickerView第05节 原子时间类 PickerYear第06节 原子时间…