LLM大模型学习:AI Agent综述

news2024/9/22 13:35:03

AI Agent是什么

将LLM思想链接到一起,自主实现用户设定的任何目标。只需要告诉AutoGPT一个目标,能自主生成执行计划。

吴恩达:“与其争论哪些工作才算是真正的 Agent,不如承认系统可以具有不同程度的 Agentic 特性。”

核心在于将复杂任务分解成多个步骤,并通过循环迭代的方式逐步优化结果。这种工作方式更接近于人类解决问题的思维模式:

  • 目标设定: 明确任务目标;

  • 规划分解: 将任务分解成多个子任务;

  • 迭代执行: 依次执行每个子任务,并根据反馈结果进行调整和优化,最终完成目标。

Agent = LLM+Planning规划+Tool use执行+Feedback纠正偏差

Agent的组成部分

在这里插入图片描述

记忆包含:短期记忆和长期记忆

Agent的规划决策(plan)

每种方式都得依赖于提示词

任务分解

思维链CoT

CoT是一种提示词工程方法,会显示输出中间逐步得推理过程:增加大模型的算数、常识和推理能力。

它成为了处理复杂任务的常用手段。

在这里插入图片描述

思维树TOT

**「TOT」**可以让LLM:

  • 自己给出多条不同的推理路径

  • 分别进行评估后,决定下一步的行动方案

  • 在必要时向前或向后追溯,以便实现进行全局的决策

在这里插入图片描述

TOT比CoT的正确率大大提高

反思与改善

ReAct

ReAct是一种提示词工程方法,它使用小样本学习来教导模型如何解决问题。

ReAct三个核心概念:

  • 思考Thought:是LLM产生下次行为的理由
  • 行动Act:LLM生成的需要执行的具体行为
  • 行为结果/反馈Obs:反馈信息会继续输入到LLM帮助下一步决策

缺点:

  • 完成k步,长度很长需要较大的上下文窗口,需要消耗大量token;
  • 由于工具种类的多样以及输出的不稳定,在LLM被广泛使用的指令微调在增强式语言模型中很难倾泄可范化性的工具使用能力到小模型上。(可以说,指令微调不可避免的会导致让小模型“背住”训练集中的工具输出)
ReWOO

将推理过程与外部观察分离,从而减少token的消耗。ReWOO分成三个独立的模块:

  • Solver:分解任务,制定一个相互依存的规划蓝图,每个任务都分给Worker
  • Worker:从工具中检索结果
  • Solver:综合所有规划和结果,生成初始任务的最终答案

AI Agent和LLM的对比

AI Agent是基于多个大模型实现的。

训练方式:

LLM(大语言模型)通常基于监督学习算法进行训练,能够根据事先设定的规则进行行为决策,适用于已知的环境和任务;

而Agent则通常基于强化学习算法进行训练,能够通过与环境的交互来学习最优的行为决策,适用于未知的环境和任务。

LLM是一种基于海量文本数据进行训练的人工智能模型,旨在理解和生成人类语言。它具有庞大的参数规模,能够学习语言数据中的复杂模式,执行文本总结、翻译、情感分析等任务。LLM的特点包括长期记忆和短期记忆模块,能够记住大量的上下文信息,并在执行任务时调用相关知识。

Agent是一种在分布式系统或协作系统中能够持续自主发挥作用的计算实体。广义上,Agent指具有智能的任何实体,可以是计算机硬件或软件。Agent具有自治性、社交能力、反应能力和预动能力等特性,能够在没有其他Agent干预的情况下运作,并与其他Agent进行交互。

应用场景:

LLM更偏向于事先设定好的规则和任务,适用于已知的环境和任务;而Agent更注重自主学习和适应能力,适用于未知的环境和任务

形态:

LLM和agent都可以实现为一个对话系统

LLM只响应用户的查询指令,实现一些生成任务,比如生成代码、文章

Agent开源的项目

AutoGPT

以LLM作为主控制器来建立AI Agents,作者提供了很多API代码来解析数据格式,帮助AI agents更好的理解和处理NL,目前还处于试验的阶段。AutoGPT是开源的,是由GPT-4驱动。

执行流程:

1、任务定义:通过name+role+goal组成prompt

2、理解任务: chatgpt对prompt通过大模型进行语义理解

3、生成方案:chatgpt输出详细的一步一步(step-by-step)解决方案

4、生成指令: LLM根据规划plan生成可执行的操作或指令

5、执行指令:调用外部工具或者chatgpt完成任务

6、输出结果:指令操作完成后,系统返回执行结果

7、评估结果:AI会评估结果以确定是否达到预期目标或是否需要进一步完善

BabyAGI

通过运行一个无线循环来工作,该循环执行以下流程:

1、从任务列表中提取第一个任务

2、将任务发送给执行代理,该代理使用Open API根据上下文完成任务

3、整理结果并将结果存储在Pinecone中

4、基于目标和前一个任务的结果创建新任务,并根据优先级对任务列表进行排序

HuggingGPT

LLM作为中心Agent,模型作为Tool和Action,执行分为以下4个阶段:

1、任务规划:LLM把用户要求分解成任务集合,决定执行顺序和任务之间的资源依赖

2、模型选择:把任务安排给对应的模型

3、任务执行:模型执行任务

4、响应生成:LLM集成模型生成结果,返回给用户

Agent系统设计和业务应用

设计一个 Agent,自动选择使用以下工具回答用户的问题:

  • 查看目录下的文件
  • 基于给定的文档回答用户问题
  • 查看与分析 Excel 文件
  • 撰写文档
  • 调用 Email 客户端发邮件

AI Agent现状

效果不是很好,存在很大的局限性,因为上下文token有限,记忆功能容易丢失,另外是一个复杂的系统,所以特别消耗内存。

执行效率
  • 需要多次与外界进行交互,LLMs消耗资源大;通过Agent自行探索并完成整个解决过程仍然比较繁琐时,也容易把问题复杂化
依赖LLM
  • 所用技术严重依赖于LLM基础能力
训练方式与效果
  • 错误积累,前面的一些步骤导致偏差,似的后续步骤越走越远。

我的话术

用2句话描述agent:agent可以说是将多个LLM思想链接到一起,agent通过prompt自动将给定的复杂任务分解为多个子任务,每个子任务去调用对应的工具,通过循环迭代的方式逐步优化结果,最后面整合出结果。虽然很智能,但是也有一些局限性,比如需要多次与外界交互,消耗资源大,导致执行效率慢,也严重依赖LLM的基础能力,如果前面一些步骤有偏差导致错误积累,所以效果不会很好。

我觉得开源项目最好可以用AutoGPT和HuggingGPT,我在coze种测试过流模式,效果不错 。

在这里插入图片描述

大模型&AI产品经理如何学习

求大家的点赞和收藏,我花2万买的大模型学习资料免费共享给你们,来看看有哪些东西。

1.学习路线图

在这里插入图片描述

第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;

第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

2.视频教程

网上虽然也有很多的学习资源,但基本上都残缺不全的,这是我自己整理的大模型视频教程,上面路线图的每一个知识点,我都有配套的视频讲解。

在这里插入图片描述

在这里插入图片描述

(都打包成一块的了,不能一一展开,总共300多集)

因篇幅有限,仅展示部分资料,需要点击下方图片前往获取

3.技术文档和电子书

这里主要整理了大模型相关PDF书籍、行业报告、文档,有几百本,都是目前行业最新的。
在这里插入图片描述

4.LLM面试题和面经合集

这里主要整理了行业目前最新的大模型面试题和各种大厂offer面经合集。
在这里插入图片描述

👉学会后的收获:👈
• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。
在这里插入图片描述

1.AI大模型学习路线图
2.100套AI大模型商业化落地方案
3.100集大模型视频教程
4.200本大模型PDF书籍
5.LLM面试题合集
6.AI产品经理资源合集

👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2122578.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

TCP 为什么是三次握手,而不是两次或四次?(通俗易懂)

TCP 三次握手是为了保证:让客户端和服务器都知道自己和对方的发送和接收都没问题。 换句话说,可以 假设客户端和服务端都维护了四个布尔变量:自己发送,自己接收,对方发送,对方接收。 初始值为 false&#…

ROS第三梯:ROS+C++实现速腾Bag包的解析

解决问题:速腾Bag包利用bag_to_pcd生成的pcd文件字段名称存在问题,多了几个异常的"_",导致强度属性无法在Intensity中显示。 解决方案:利用sensor_msgs库进行数据读取和转换成sensor_msgs::PointCloud格式,再…

避免17个最常见的电子邮件营销错误

我们都曾在电子邮件营销中犯过错。你点击发送,随后那种沉重的感觉袭来。你搞砸了,现在所有人都能看到。就像把信息放入瓶子丢进互联网的浩瀚海洋中,无法收回。 有些电子邮件营销错误显而易见,可能会破坏你投入了大量心血的营销活…

多窗口联系

使用信号和槽实现多个界面的跳转 准备好两个界面 一个界面准备好信号 一个界面准备好槽 连接两个界面的信号和槽 主界面的头文件 #ifndef WIDGET_H #define WIDGET_H#include <QWidget>QT_BEGIN_NAMESPACE namespace Ui { class Widget; } QT_END_NAMESPACEclass Wi…

俄罗斯电商没有技巧,OZON换季相关爆品

Top1 加热器 Обогреватель кварцевый напольный ИЖЭКО М 800 вт СВ01 энергосберегающий электрообогреватель 商品id&#xff1a;1352359815 月销量&#xff1a;781 OZON选品分析工具&#…

Xilinx系FPGA学习笔记(六)RAM的IP核学习

系列文章目录 文章目录 系列文章目录块RAM生成 块RAM生成 对于RAM来说&#xff0c;也有两种: 在 Memories & Storage Elements 下&#xff0c;一个是 Distributed Memory Generator&#xff0c;另一个是 BlockMemory Generator&#xff0c;这与ROM是类似的 这里的常规接口…

CSP-CCF★★★201812-2小明放学★★★

目录 一、问题描述 二、解答 &#xff08;1&#xff09;注意&#xff1a; &#xff08;2&#xff09;80分版&#xff1a; &#xff08;3&#xff09;100分版&#xff1a; 三、总结 一、问题描述 二、解答 &#xff08;1&#xff09;注意&#xff1a; 题目的n小于等于10的…

9月10(信息差)

&#x1f30d;华为最便宜小折叠&#xff01;华为nova Flip今晚发布&#xff1a;搭载麒麟8000芯片 从曝光的跑分信息来看&#xff0c;nova Flip将搭载麒麟8000处理器&#xff0c;也就是nova 12 Pro/Ultra的同款&#xff0c;采用8核心的134组合&#xff0c;大核是1颗2.4GHz的Cort…

怎么画实体关系图E-R?用这款在线绘图工具简单又好用!

ER图(Entity-Relationship Diagram&#xff0c;即实体-关系图)是一种用于数据库设计的图形化工具&#xff0c;用于描述现实世界的概念模型。它由Peter Chen于1976年首次提出&#xff0c;现已成为数据库建模和系统分析设计中最常用的工具之一。 ER图通过图形化的方式&#xff0…

Mamba模型学习笔记

笔记来源&#xff1a;bilibili Transformer 的死穴 Transformer 结构的核心是自注意力机制层&#xff0c;无论是 encoder 还是 decoder&#xff0c;序列数据都先经过位置编码后喂给这个模块。 但是自注意力机制的计算范围仅限于窗口内&#xff0c;而无法直接处理窗口外的元素…

支持iPhone 16新品预售,饿了么同步上线专人配送等特色服务

9月10日凌晨&#xff0c;2024年 Apple 秋季新品发布会上正式揭晓iPhone 16新机。9月10日一早&#xff0c;饿了么同步宣布&#xff1a;今年将携手近4000家Apple 授权专营店&#xff0c;支持iPhone 16新品预售及现货的同步开售。新机现货首发当日&#xff0c;饿了么消费者最快半小…

Mysql | 知识 | 事务隔离级别

转账案例缘起 我的钱包&#xff0c;共有 100 元。 今天我心情好&#xff0c;我决定给你的转账99元&#xff0c;最后的结果肯定是我的余额变为 1元&#xff0c;你的余额多了99元。 转账这一动作在程序里会涉及到一系列的操作&#xff0c;假设我向你转账 99元 的过程是有下面这…

哪些原因导致ERP成功率这么低?

哪些原因导致ERP成功率这么低&#xff1f; 有一句名言是“幸福的家庭都是相似的&#xff0c;不幸的家庭却各有各的不幸。”&#xff0c;这句名言应用到企业数字化的实施落地中也是适用的&#xff0c;数字化成功实施的企业也都是相似的&#xff0c;数字化实施失败的企业却有各种…

安卓玩机工具-----适合安卓机型的“搞机工具箱” 功能齐全 玩机推荐

搞机工具箱最新版是一款相当出色的电脑端手机工具箱软件&#xff0c;搞机工具箱正式版功能强劲&#xff0c;可以帮助用户不需要root就能够直接对手机进行调节&#xff0c;方便对手机进行更加全面的掌控&#xff0c;搞机工具箱便捷好用&#xff0c;只需要根据文字提示及自己的需…

开源的 Windows 12 网页体验版!精美的 UI 设计、丰富流畅的动画

大家周二好呀&#xff01;博主今天给小伙伴们分享一款炫酷的 Windows 12 体验版&#xff0c;网页效果拉满&#xff0c;非常值得我们去尝试&#xff01; 如果你对未来的Windows操作系统充满期待&#xff0c;那么这款开源的Windows 12 网页体验版绝对不容错过&#xff01;这不仅…

如何编辑pdf文件?金舟PDF编辑器解决PDF编辑、转换问题!

如何编辑pdf文件&#xff1f;pdf是电脑上便携的文档格式之一&#xff0c;不管是阅读&#xff0c;还是打印&#xff0c;都不会出现排版错乱的问题&#xff0c;并且在任意系统上都能“正常”展示&#xff0c;不受影响。这也是pdf文件运用较为广泛的原因之一。 不少用户在接触到pd…

【数据结构与算法 | 灵神题单 | 前后指针(链表)篇】力扣19, 61,1721

1. 力扣19&#xff1a;删除链表的倒数第N个节点 1.1 题目&#xff1a; 给你一个链表&#xff0c;删除链表的倒数第 n 个结点&#xff0c;并且返回链表的头结点。 示例 1&#xff1a; 输入&#xff1a;head [1,2,3,4,5], n 2 输出&#xff1a;[1,2,3,5]示例 2&#xff1a; …

cache miss问题C++示例

原题是&#xff1a; const int LEN 64*1024*1024; int *arr new int[LEN]; for (int i 0; i < LEN; i 2) arr[i] * i; // 循环1 for (int i 0; i < LEN; i 8) arr[i] * i; // 循环2第二个循环比第一个循环少了四倍的计算量&#xff0c;理论上应该要快4倍&#xff…

深度解析RAG:你必须要了解的RAG优化方法

RAG&#xff08;Retrieval-Augmented Generation&#xff09;是一种结合检索和生成能力的技术框架&#xff0c;旨在通过从外部知识库中检索相关信息来增强生成模型的输出。其基本思想是利用大型语言模型&#xff08;LLM&#xff09;的生成能力&#xff0c;同时通过检索机制获取…

OpenStack × OceanBase: 打造高可用可扩展的基础设施平台

OceanBase 社区资深总监封仲淹在9月3日参加 OpenInfra 亚洲峰会中&#xff0c;分享了OceanBase与OpenStack的联合解决方案。本文将介绍这一联合方案的技术亮点及其为用户带来的独特价值。 OpenStack长期以来一直是云计算领域的先行者&#xff0c;通过提供强大的开源平台&#x…