AI Agent认知框架(ReAct、函数调用、计划与执行、自问自答、批判修正、思维链、思维树详解和对比,最后表格整理总结

news2025/4/24 20:41:09

以下是主流AI Agent认知框架的详细说明、对比及表格总结:
在这里插入图片描述


1. 各认知框架详解

(1) ReAct (Reasoning + Action)
  • 定义:结合推理(Reasoning)和行动(Action)的循环过程。
  • 核心机制
    • 模型先推理(Reason)生成可能的解决方案或步骤。
    • 执行(Act)具体操作(如查询工具、调用API)。
    • 根据反馈结果迭代优化。
  • 适用场景:需要逐步解决问题的复杂任务(如多步骤推理、工具调用)。
  • 示例:用户问“纽约到巴黎的航班价格”,模型先推理需要查询航班数据,再调用API获取实时价格。
(2) 函数调用(Function Calling)
  • 定义:模型通过预定义的函数接口直接调用外部工具或API。
  • 核心机制
    • 模型生成符合函数参数的自然语言指令。
    • 系统解析指令并调用对应函数执行。
  • 适用场景:需要调用结构化工具(如数据库查询、API接口)的任务。
  • 示例:调用天气API获取实时天气数据。
(3) 计划与执行(Plan-And-Execute)
  • 定义:分阶段处理任务,先制定计划再执行。
  • 核心机制
    1. 计划阶段:模型生成详细步骤或子任务。
    2. 执行阶段:逐步完成每个子任务并整合结果。
  • 适用场景:复杂多步骤任务(如编写代码、解决问题)。
  • 示例:解决数学题时先规划解题步骤,再逐步计算。
(4) 自问自答(Self-Ask)
  • 定义:模型通过生成问题并自行回答来逐步推导答案。
  • 核心机制
    • 模型生成中间问题,模拟人类的思考过程。
    • 逐步回答问题,最终整合答案。
  • 适用场景:需要分步推理或知识补全的任务(如阅读理解、逻辑推理)。
  • 示例:阅读一段文字后,自问关键细节并回答以提炼答案。
(5) 批判修正(Critique & Revise / Self-Reflection)
  • 定义:模型自我检查输出并迭代优化。
  • 核心机制
    1. 生成初步答案:模型输出初始结果。
    2. 批判阶段:模型评估答案的合理性。
    3. 修正阶段:根据批判结果调整并重新生成。
  • 适用场景:需要高准确性的任务(如写作、代码调试)。
  • 示例:模型生成代码后,自我检查语法错误并修正。
(6) 思维链(Chain-of-Thought, COT)
  • 定义:通过逐步展开中间推理步骤生成最终答案。
  • 核心机制
    • 模型以自然语言详细描述推理过程。
    • 分步骤推导,最终整合为答案。
  • 适用场景:需要展示思考过程的任务(如数学题、逻辑推理)。
  • 示例:解决数学题时分步写出计算过程。
(7) 思维树(Tree-of-Thought, TOT)
  • 定义:通过分支探索多种可能的推理路径。
  • 核心机制
    • 模型生成多个可能的中间思路(分支)。
    • 评估并选择最优路径继续推理。
  • 适用场景:需要探索多种可能性的任务(如创意生成、策略规划)。
  • 示例:设计解决方案时生成多个分支思路并筛选最佳方案。

2. 核心差异对比

关键维度对比
框架核心机制是否依赖外部工具是否分阶段是否自我修正典型输出形式
ReAct推理+行动循环部分(迭代)动态步骤结果
函数调用直接调用函数工具返回的数据
计划与执行分阶段计划+执行可选结构化步骤输出
自问自答生成问题并回答分步推理过程
批判修正自我检查+迭代优化修正后的最终答案
思维链(COT)逐步展开推理过程详细推理步骤
思维树(TOT)分支探索多种路径多分支结果+最优选择
技术特点差异
  • 是否需要外部工具
    • ReAct、函数调用依赖外部工具,其他框架主要依赖模型自身推理。
  • 推理路径
    • COT是线性推理,TOT是分支探索。
  • 迭代能力
    • 批判修正框架具备自我迭代能力,其他框架多为单次推理。

3. 选择建议

需求场景推荐框架理由
需要逐步推理并调用工具ReAct动态推理与行动结合
直接调用外部API或函数函数调用简洁高效,适合结构化任务
复杂多步骤任务规划计划与执行明确分阶段处理
需要展示中间思考过程思维链(COT)详细推理过程透明
需要探索多种可能性思维树(TOT)分支式探索最优解
需要高准确性输出批判修正自我检查与迭代优化

总结表格

框架名称核心特点适用场景优缺点
ReAct推理+行动循环多步骤工具调用灵活但需要工具支持;适合复杂任务
函数调用直接调用函数结构化API调用简单高效;依赖工具接口
计划与执行分阶段计划+执行复杂任务规划结构清晰;需明确步骤划分
自问自答生成问题并回答分步推理任务思维过程透明;计算开销较大
批判修正自我检查+迭代优化高精度输出需求输出质量高;需多次迭代
思维链(COT)逐步展开推理过程需要展示推理过程可解释性强;线性路径可能遗漏最优解
思维树(TOT)分支探索多种路径需要探索多种可能性创新性强;计算资源需求高

总结

  • 工具依赖型:ReAct、函数调用 → 需结合外部工具。
  • 推理过程透明:COT、Self-Ask → 适合需要解释的场景。
  • 探索与优化:TOT、Critique & Revise → 多分支或高精度需求。
    根据具体任务需求(如是否需要工具、推理路径、输出形式)选择合适的框架。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2341933.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

搭建TypeScript单元测试环境

我们在学习TypeScript的时候如果能够搭建一个单元测试的环境,那写些demo会很简单,下面我们使用jest来搭建一个单元测试环境 Jest 是一个由 Facebook 开发并开源的 JavaScript 测试框架,被广泛应用于前端和 Node.js 项目的单元测试。以下是关…

第十一届机械工程、材料和自动化技术国际会议(MMEAT 2025)

重要信息 官网:www.mmeat.net 时间:2025年06月23-25日 地点:中国-深圳 部分展示 征稿主题 智能制造和工业自动化 复合材料与高性能材料先进制造技术 自动化机器人系统 云制造与物联网集成 精密制造技术 智能生产线优化 实时数据分析与过…

leetcode 1143. Longest Common Subsequence

目录 题目描述 第一步,明确并理解dp数组及下标的含义 第二步,分析明确并理解递推公式 第三步,理解dp数组如何初始化 第四步,理解遍历顺序 代码 题目描述 这道题和第718题的区别就是,本题求的是最长公共子序列的长…

stack和queue的学习

stack的介绍 stack的文档介绍 stack是一种容器适配器,专门用在具有后进先出操作的上下文环境中,其删除只能从容器的一端进行元素的插入与提取操作。stack是作为容器适配器被实现的,容器适配器即是对特定类封装作为其底层的容器,…

微服务Nacos组件的介绍、安装、使用

微服务Nacos组件的介绍、安装、使用 在微服务架构日渐普及的今天,服务注册与配置管理成了系统架构中的关键环节。阿里巴巴开源的 Nacos(Naming and Configuration Service)正是解决这一问题的利器。本文将为你全面介绍 Nacos 的概念、安装方…

SpringBoot_为何需要SpringBoot?

Spring Boot 出现前的开发困境 配置繁琐 大量的 XML 配置文件 Spring 是一个非常优秀的轻量级框架,但其配置却是重量级的需要编写大量的 XML 配置文件或注解配置,使项目配置复杂且难以维护配置文件中容易出现错误,且排查问题困难开发过程中…

格式工厂 v5.18最新免安装绿色便携版

前言 用它来转视频的时候,还能顺便给那些有点小瑕疵的视频修修补补,保证转出来的视频质量杠杠的。更厉害的是,它不只是转换那么简单,还能帮你把PDF合并成一本小册子,视频也能合并成大片,还能随心所欲地裁剪…

MQTTX + MCP:MQTT 客户端秒变物联网 Agent

引言:MQTTX 与 MCP 的融合 作为最受欢迎的 MQTT 客户端工具,MQTTX 在 1.12.0 beta 版本中集成了模型上下文协议(MCP)到 Copilot AI 功能中,显著提升了服务能力。这一融合让 MQTTX 转变为 MCP Host(也就是发…

快手砍掉本地生活的门槛

一场本地商家的效率革命。 作者|景行 编辑|杨舟 “两斤鸡翅根七块九,两盒蓝莓九块钱,两公斤卫生纸十四块九一提。” 这是朝阳佳惠超市,在快手一则普通的短视频内容。 佳惠超市在辽宁省朝阳市有22家分店,打开佳惠超市的相关快手…

Python基础语法3

目录 1、函数 1.1、语法格式 1.2、函数返回值 1.3、变量作用域 1.4、执行过程 1.5、链式调用 1.6、嵌套调用 1.7、函数递归 1.8、参数默认值 1.9、关键字参数 2、列表 2.1、创建列表 2.2、下标访问 2.3、切片操作 2.4、遍历列表元素 2.5、新增元素 2.6、查找元…

【AI】Windows环境安装SPAR3D单图三维重建心得

效果一览 左图为原始单个图像,右图为通过SPAR3D重建后的三维建模,可以看出效果还是不错的。 本地环境配置 系统:Windows 11 专业版CPU:i5-13400F内存:32GBGPU:RTX3060 12GBcuda:11.8conda&…

使用docker在manjaro linux系统上运行windows和ubuntu

因为最近项目必须要使用指定版本的solidworks和maxwell(都只能在win系统上使用), 且目前的ubuntu容器是没有桌面的,导致我运行不了一些带图形的ros2功能。无奈之下,决定使用docker-compose写一下配置文件,彻底解决问题…

Redis(01)Redis连接报错Redis is running in protected mode……的解决方案

一、引言:从一个典型连接错误说起 在分布式系统开发中,Redis 作为高性能缓存中间件被广泛使用。 然而,当我们首次部署 Redis 并尝试从外部客户端连接时,常常会遇到以下错误: DENIED Redis is running in protected m…

18487.1-2015-解读笔记之四-交流充电之流程分析

前面简单分析了国标交流充电桩插枪监测逻辑和PWM控制逻辑,下面简单分析一下交流充电流程 附录A 交流充电连接过程和控制时序如下: 由此可以将充电流程大概分为几个阶段: 1.充电连接阶段 充电连接阶段CC(电阻由无穷大到R4RC&…

Linux 管道理解

一、什么是管道 1.1 unix中最古老的进程间通信 1.2 一个进程链接到另一个进程的数据流称为“管道”: 图解: 二、管道通信的原理 2.1当我们创建一个进程然后打开一个文件的时候 会经过以下步骤: ①首先要描述这个进程,为这个…

国产RK3568+FPGA以 ‌“实时控制+高精度采集+灵活扩展”‌ 为核心的解决方案

RK3568FPGA方案在工业领域应用的核心优势 一、‌实时性与低延迟控制‌ ‌AMP架构与GPIO中断技术‌ 通过非对称多处理架构(AMP)实现Linux与实时操作系统(RTOS/裸机)协同,主核负责调度,从核通过GPIO中断响应紧…

Pycharm(十五)面向对象程序设计基础

目录 一、面向对象基本概述 class 类名: 属性(类似于定义变量) 行为(类似于定义函数,只不过第一个形参要写self) 二、self关键字介绍 三、在类内部调用类中的函数 四、属性的定义和调用 五、魔法方法init方法 六、魔法方法str和del方法 七、案例-减肥 一、…

华三(H3C)与华为(Huawei)设备配置IPsec VPN的详细说明,涵盖配置流程、参数设置及常见问题处理

以下是针对华三(H3C)与华为(Huawei)设备配置IPsec VPN的详细说明,涵盖配置流程、参数设置及常见问题处理: 一、华三(H3C)设备IPsec VPN配置详解 1. 配置流程 华三IPsec VPN配置主要…

店匠科技摘得 36 氪“2025 AI Partner 创新大奖”

全场景 AI 方案驱动跨境电商数智化跃迁 4 月 18 日,36 氪 2025 AI Partner 大会于上海盛大开幕。大会紧扣“Super App 来了”主题,全力探寻 AI 时代的全新变量,探索 AI 领域下一个超级应用的无限可能性。在此次大会上,跨境电商独立站 SaaS 平台店匠科技(Shoplazza)凭借“店匠跨…

Joint communication and state sensing under logarithmic loss

摘要——我们研究一种基本的联合通信与感知设置,其中发射机希望向接收机传输一条消息,并同时通过广义反馈估计其信道状态。我们假设感知目标是获得状态的软估计(即概率分布),而非通常假设的点估计;并且我们…