AI Agent（LLM Agent）入门解读

AI Agent（LLM Agent）入门解读

news2025/4/28 2:35:21

1. 什么是AI Agent？

AI Agent可以理解为一个智能体，包括感知模块、规划决策模块和行动模块，类似于人类的五官、大脑和肢体。它能帮助人类处理复杂的任务，并能根据环境反馈进行学习和调整。

五官可以理解为感知模块，大脑为规划决策模块，肢体是行动模块。如图：在这里插入图片描述
**举个例子：**用手摸了一下电线，感知模块被电麻了，此时大脑决策规划模块发出信号，把手拿走快逃。接着行动模块控制手从电线上拿开（当然也可能拿不开），这就是资料里常见的模型。将这个过程抽象出来，如图：
在这里插入图片描述
可以看到，最关键的部分就是大脑部分，即规划决策模块。以前这儿比较薄弱，只有状态、记忆，如今有了大模型，让上述框架变得强大了起来。暂时忽略感知和反馈模块，突出大模型LLM的作用，如图：

再将其抽取整理，如图：
在这里插入图片描述
从细节角度进行梳几个模块：

1.1 记忆模块

又分为短期记忆和长期记忆，如上下文学习就是短期记忆，一般被上下文窗口长度限制；长期记忆则保存较长时间，一般外部向量保存。注意，从某种程度上，感知也可以归类在记忆模块里，如视觉、听觉、触觉等。短期记忆如同电脑中的内存，在LLM中受到Transformer和上下文窗口长度的限制，长期记忆可以理解为硬盘，包含陈述式记忆和（如事件或事实），程序式记忆（如打字技能等）。整理后，如图：
在这里插入图片描述

1.2 规划决策模块

包含四个模块，其中，思维链和子目标分解是为了处理更为复杂的任务，反思和自我批评模块能从错误中吸取教训，提高结果质量。整理后如图：
在这里插入图片描述

1.3 工具模块

强调软件、API的调用，如日历、计算器、代码解释器、搜索等，目的是为了解决实际问题。整理后如图：
在这里插入图片描述
总计一下，当给予一个prompt，LLM记忆模块的短期记忆和长期记忆相互配合，对任务进行分解，并对错误进行反思、批评纠正，最终做出了规划决策，然后调用合适的外部工具，并最后付出行动。

2. Agent与LLM之间的关系

上述过程中，GPT扮演了大脑的角色，其他模块扮演了其他的协同配合，从而突破了简单的问答工作。在这儿插播一张图：
在这里插入图片描述
是不是有些熟悉了，回到了最经典的结构，总结成公式，即：

$A g e n t = LL M + 记忆 + 规划决策 + 工具使用$

3. AI Agent能起到什么实际作用

引用一个HuggingFace的案例。HuggingFace上有很多有趣的模型，一般新手不知道怎么选择模型，提出的HuggingGPT(Shen et al. 2023)就是一个AI Agent，借助ChatGPT根据描述，选择可用模型并执行。

在这个过程中包含四个阶段：

任务的规划：LLM做大脑，任务请求分为多个任务。包括任务类型、ID、依赖项和参数。
模型选择：Agent根据模型ID，选择对应模型处理用户请求。此处可以选择多个模型。
任务执行：执行特定的每个模型并记录结果。
响应生成：LLM接受执行结果，汇总至用户。

过程汇总如图：
在这里插入图片描述
这就是一个比较有趣且好玩的Agent实践案例。
类似的项目还有很多，如：ChatDev、AutoGPT、GPT-engineer

4. 如何上手学习

LLM是核心，底层是Transformer和LLaMA，搞定就ok，当然Attention可以作为知识扩展进行学习。
感知部分是多模态，涉及的就是深度学习里的强化学习。

参考

动画科普AI Agent
AI Agent（或者LLM Agent）深度讲解
LLM Powered Autonomous Agents
AI Agent，为什么是AIGC最后的杀手锏？

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1549266.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

2024年上半年数学建模竞赛一览表（附赠12场竞赛的优秀论文+格式要求）[电工、妈杯、数维、五一等12场]

2024年上半年数学建模竞赛一览表（附赠12场竞赛的优秀论文+格式要求）[电工、妈杯、数维、五一等12场]

为了帮助大家更好地备战今年上半年十二场数学建模竞赛，我们为大家收集到了这十二场相关竞赛的优秀论文以及格式要求，具体内容如下所示。资料获取在文末文中资料来源名称竞赛官方网站天府杯https://www.tfmssy.org.cn/认证杯http://www.tzmcm.cn/i…

阅读更多...

中国土壤厚度空间分布数据

中国土壤厚度空间分布数据

土壤层次分为覆盖层林溶层淀积层母质层，其中在林溶层中的最上面那层就是我们通常说的土壤厚度在这一层中，这一层也被称为腐殖层，是肥力性质最好的一层，植物根系和微生物也集中在这一层。至于覆盖层在森林土壤中比较常见&#x…

阅读更多...

零基础学python之高级编程(6)---Python中进程的Queue 和进程锁,以及进程池的创建（包含详细注释代码）

零基础学python之高级编程(6)---Python中进程的Queue 和进程锁,以及进程池的创建（包含详细注释代码）

Python中进程的Queue 和进程锁,以及进程池的创建文章目录 Python中进程的Queue 和进程锁,以及进程池的创建前言一、进程间同步通信(Queue)二、进程锁（Lock）三、创建进程池Poorpool 类方法: End! 前言大家好,上一篇文章,我们初步接触了进程的概念及其应…

阅读更多...

matlab实现神经网络

matlab实现神经网络

一、原理人工神经网络是具有适应性的简单神经元组成的广泛并互连的网络，它的组织能够模拟生物神经系统对真实世界物体作出的交互式反应。人工神经网络具有自学习、自组织、较好的容错性和优良的非线性逼近能力将神经网络的学习能力引入到模糊系统中，…

阅读更多...

Zabbix 配置使用

Zabbix 配置使用

目录配置流程添加组机组添加模板添加主机配置图形配置大屏 Monitoring 配置地图最新数据故障使用IT服务使用报表资产管理全局搜索导入导出用户权限用户组权限用户匿名用户调试模式与 LDAP 对接维护模式故障确认批量更新配置流程…

阅读更多...

35.HarmonyOS App(ArkUI)使用父组件@Builder装饰的方法初始化子组件@BuilderParam报错

35.HarmonyOS App(ArkUI)使用父组件@Builder装饰的方法初始化子组件@BuilderParam报错

HarmonyOS App(ArkUI)使用父组件Builder装饰的方法初始化子组件BuilderParam报错 Type void is not assignable to type () > void. <tsCheck> 去掉括号()就可以了装饰器： 用于装饰类、结构、方法以及变量，并赋予其特殊的含义。如上述示例中En…

阅读更多...

fastadmin学习01-windows下安装部署

fastadmin学习01-windows下安装部署

下载源代码官网安装解压，然后使用phpstorm打开修改配置文件创建数据库 -- drop database fastadmin01; create database fastadmin01;这样fastadmin就部署好了访问主页也能看到前台页面

阅读更多...

基于OneAPI+ChatGLM3-6B+FastGPT搭建LLM大语言模型知识库问答系统

基于OneAPI+ChatGLM3-6B+FastGPT搭建LLM大语言模型知识库问答系统

搭建大语言模型知识库问答系统部署OneAPI部署一个LLM模型部署嵌入模型部署FastGPT新建FastGPT对话应用新建 FastGPT 知识库应用部署OneAPI 拉取镜像 docker pull justsong/one-api创建挂载目录 mkdir -p /usr/local/docker/oneapi启动容器 docker run --name one-api -d …

阅读更多...

LeetCode讲解算法2-数据结构[栈和队列]（Python版）

LeetCode讲解算法2-数据结构[栈和队列]（Python版）

文章目录一、栈1.1 栈的定义1.2 栈的实现分析步骤1.3 栈的应用匹配圆括号匹配符号模2除法（十进制转二进制）进制转换二、队列2.1 单向队列2.2 双端队列2.3 队列的应用验证回文串滑动窗口最大值一、栈 1.1 栈的定义栈是一种线性数据结构，栈…

阅读更多...

STM32的SPI通信介绍

STM32的SPI通信介绍

SPI简介 SPI:串行外设接口,与IIC一样都是通用数据总线。四根通信线：SCK，MOSI（DO），MISO（DI），SS。同步（共用一根时钟线），全双工（数据发…

阅读更多...

js算法记录

js算法记录

> 更多请前往 https://www.passerma.com/article/86 滑动窗口 1 给定一个矩阵，包含N*M个整数，和一个包含K个整数的数组。现在要求在这个矩阵中找一个宽度最小的子矩阵，要求子矩阵包含数组中所有的整数 function minSubmatrixWidth(mat…

阅读更多...

Openstack创建和操作实例，实现与外部网络通信

Openstack创建和操作实例，实现与外部网络通信

一、熟悉OpenStack图形界面操作 1、了解Horizon项目 Horizon项目各OpenStack服务的图形界面都是由Horizon提供的。Horizon提供基于Web的模块化用户界面。Horizon为云管理员提供一个整体的视图。Horizon为终端用户提供一个自主服务的门户。Horizon由云管理员进行管理与控制&a…

阅读更多...

SpringBoot学习笔记一、SpringBoot应用初创建以及应用

SpringBoot学习笔记一、SpringBoot应用初创建以及应用

一、创建SpringBoot的两种方式 1.Spring Initializr方式创建 （1）第一步在IDEA中选择 File-->NEW-->Project ，选择 Spring Initializr ，指定Maven坐标、包名、指定 JDK 版本 1.8 ，然后点击Next 。如下图&#x…

阅读更多...

修改Jupyter Notebook的默认路径，以及在PowerShell中自定义其启动路径

修改Jupyter Notebook的默认路径，以及在PowerShell中自定义其启动路径

修改Jupyter Notebook的默认路径，以及在PowerShell中自定义其启动路径设置 Jupyter Notebook 配置文件，修改默认路径要在PowerShell中设置自定义的启动脚本，以确保Jupyter Notebook能够自动定位到当前路径设置后的效果在使用Jupyter Notebo…

阅读更多...

遇到了问题，Firepower 2140配置带外IP时报错 commit-buffer failed

遇到了问题，Firepower 2140配置带外IP时报错 commit-buffer failed

onsite we have a cisco firepower 2140 device which run ASA as we try to modify the 2140 OOB mgmt ip by CLI, we got an error why ? 经过查询发现，需要进入ASA里面打上以下这条命令，并重启ASA 1 修改模式并重启 ciscoasa# configure termina…

阅读更多...

C语言例4-15：从键盘输入一个整数，求其绝对值并输出。

C语言例4-15：从键盘输入一个整数，求其绝对值并输出。

代码如下： //从键盘输入一个整数，求其绝对值并输出。 #include<stdio.h> int main(void) {int n;printf("输出一个整数： \n");scanf("%d",&n); //从键盘输入一个整数保存至变量nif(n<0) //…

阅读更多...

Python爬虫之爬取网页图片

Python爬虫之爬取网页图片

当我们想要下载网页的图片时，发现网页的图片太多了，无从下手，那我们写一个脚本来爬取呗。这次的脚本是专门针对某个外国网站使用的，因此仅供参考思路。在测试的过程中，我发现网站使用了发爬虫机制，具体就…

阅读更多...

连接数据库（MySQL）的JDBC

连接数据库（MySQL）的JDBC

目录 JDBC简介快速入门API详解DriverManager（驱动管理类）注册驱动：获取数据库连接(对象)： Connection（数据库连接对象）获取执行SQL的对象管理事务 Statement(执行SQL语句)执行DML、DDL语句执行DQL语句 Resu…

阅读更多...

【LLM多模态】Cogvlm图生文模型结构和训练流程

【LLM多模态】Cogvlm图生文模型结构和训练流程

note Cogvlm的亮点： 当前主流的浅层对齐方法不佳在于视觉和语言信息之间缺乏深度融合，而cogvlm在attention和FFN layers引入一个可训练的视觉专家模块，将图像特征与文本特征分别处理，并在每一层中使用新的QKV矩阵和MLP层。通过引…

阅读更多...

LED基础知识分享（三）

LED基础知识分享（三）

大家好，我是砖一。今天给大家分享一下，LED的基础知识，有照明行业，或者对LED感兴趣的朋友，可以学习一下，希望对你有用~ 一、热扩散物质本身或当物质与物质接触时，能量的传递就被称为热传导&a…

阅读更多...

推荐文章

最新文章