关于思维和智能体模型的思考（2）

关于思维和智能体模型的思考（2）

news2025/4/5 15:13:49

在关于思维和智能体模型的思考（1）一文中，我们提出了思维和Agent 模型，提出了使用确定连接的智能体构建的思维模型。本文我们继续讨论思维与智能体，重点探讨另一种智能体-自主智能体，并且提出了自主智能体的运行和调度方法。

思维模型的两种不同形式

在我的上一篇博文中提出，思维模型是由一组相互连接的智能体和环境信息构成的。我们也强调，如果说人类大脑的思维是一组相互连接的智能体的话，那么智能体之间的连接是神秘的，不可预知。

与此同时，对于许多目标而言，人类已经积累了大量已有的思维过程范式，正是因为如此，我们能够预先规划解决问题，达成目标的智能体网络。从而使思维的效率更高。避免大脑从头全局探索思维路径。在此基础上我们提出了基于智能体网络的思维模型

这个思维模型对于简单目标的实现是有效的，但是对于一些复杂的问题而言，这种思维网络将会变得非常的庞大。

为了解决这个问题，我们可以导入更加灵活的智能体模型-自主智能体。

自主智能体

随着大语言模型的持续火爆，利用其构建 AI 智能体的研究陆续进入人们的视线。AI 智能体这个概念也流行开来，人们研究和描绘了各种形式的智能体，不断突破人们的想象力。

OpenAI 安全系统（Safety Systems）负责人 Lilian Weng 写了一篇关于 AI 智能体的博客。她认为 AI 智能体的核心驱动力是大语言模型，规划（Planning）、记忆（Memory）和工具使用（Tool Use）是实现它的三个关键组件。

在大语言模型（LLM）赋能的自主智能体系统中，LLM 充当了智能体的大脑，其三个关键组件分别如下：

首先是规划，它又分为以下内容：

子目标和分解。智能体将大型任务分解为更小、可管理的子目标，从而高效处理复杂的任务；

反思和完善：智能体可以对过去的行为展开自我批评和自我反思，从错误中吸取教训，并针对未来的步骤进行完善，提高最终结果的质量。

其次是记忆，分为了短期记忆和长期记忆：

短期记忆：作者认为所有的上下文学习（参见提示工程）都是利用模型的短期记忆来学习。

长期记忆：为智能体提供了长时间保留和回忆（无限）信息的能力，通常利用外部向量存储和快速检索实现。

最后是工具使用：

智能体学习调用外部 API 来获取模型权重中缺失的额外信息（通常在预训练后很难更改），包括当前信息、代码执行能力、对专有信息源的访问等。

上述的智能体模型强调了智能体的自主性。我们将这种智能体称为自主智能体。

----自主智能体是能够感知环境、自主决策并且具备短期与长期记忆的计算机模型，它能够模仿人类大脑工作机制，根据任务目标，主动完成任务。

在自主智能体的概念中，弱化了智能体之间的连接，智能体具备自洽性。它完全根据环境的变化自主地运转。

两种Agent 模型的统一性

两种Agent 模型本质上是一致的，只是方式不同。

对于自主智能体而言，每个智能体自主地根据环境的变化自主运行，同时又将改变环境，智能体的信号是蕴含在环境信息中的，相比信号智能体而言，它们的信号是隐身在环境之中的。

自主智能体思维模型

从前面的讨论可以看出，自主智能体具有规划，记忆和工具三大特征。如果在计算机系统中仿真运行的话。自主智能体的思维模型具有如下特点：

每个智能体完成一项单一目标的任务
智能体内部维护一种目标链。大的目标是可以分解为一系列更小的目标。
智能体的小目标是由其它智能体完成的。智能体之间要共享目标信息。在环境信息中，包含了一个目标队列。智能体可以发布需要实现的小目标。
如果一个目标加入了目标队列，承担完成队列中目标的智能体主动地尝试完成这项目标。
可以由智能体自主判断是否能够完成目标，也可以通过智能体注册的方式，由运行时判断哪个智能体能够完成目标队列中的目标。
智能体的执行可以是轮询方式，也可以是并行方式。

根据上面的特点，可以有两种智能体运行时实现方法：

轮询方式

这种方式与信号智能体调度中的信号队列的处理方式是类似的。

调度方式

每个Agent 都注册到运行时，注册信息中包括了智能体的描述，调度程序根据目标和智能体的描述，利用大模型LLM调用智能体运行。当智能体能够从环境信息中获取了足够的信息后就执行。这种方式简化了智能体的模型对目标的判断。

自主智能体和信号智能体相结合

自主智能体能够与信号功能块混合使用。在应用中，可能自主智能体是一个“大”的智能体，而信号智能体是“小”的智能体。

智能体OS？

在智能体模型的基础之上，是否会出现支持智能体的操作系统？我想是可能的。下一步，我们将是实现一个自主Agent 的调度系统。

结论

智能体的实现是非常灵活的，不应该是少数固定的几种方式。也绝非靠简单的设置就能实现，也需要进一步的研究。努力吧！别停留在老外的几篇论文之上，创新的机会很多！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1924116.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

《黑马点评》Redis高并发项目实战笔记【完结】P1~P72

《黑马点评》Redis高并发项目实战笔记【完结】P1~P72

花费4周敲完《黑马点评》的课程，做了详细的笔记，感觉受益匪浅，一直一直都在不停成长着。突然想起《苍穹外卖》系列至今已收获200个赞，500个收藏，好评颇多，私信我的人不计其数，在此谢谢大家。 …

阅读更多...

从零开始学习PX4源码3(如何上传官网源码到自己的仓库中)

从零开始学习PX4源码3(如何上传官网源码到自己的仓库中)

目录文章目录目录摘要1.将PX4源码上传至腾讯工蜂2.从腾讯工蜂克隆源码到本地ubuntu3.如何查看自己源码的版本信息摘要本节主要记录从零开始学习PX4源码3(如何上传官网源码到自己的仓库中)及如何查看PX4的固件版本信息，欢迎批评指正！ PX4源码版本V1.…

阅读更多...

东软“引战”国家队通用技术“补链”大国重器

东软“引战”国家队通用技术“补链”大国重器

向来低调温和的东软创始人刘积仁，这一次抛出了“王炸”级的资产交易。 7月3日，《多肽链》获得一则足以引爆国内医疗设备行业的投资信息：被东软集团视为核心资产、掌上明珠的东软医疗，成功引入通用技术集团资本有限公司与中国国有…

阅读更多...

240713_昇思学习打卡-Day25-LSTM+CRF序列标注（4）

240713_昇思学习打卡-Day25-LSTM+CRF序列标注（4）

240713_昇思学习打卡-Day25-LSTMCRF序列标注（4） 最后一天咯，做第四部分。 BiLSTMCRF模型在实现CRF后，我们设计一个双向LSTMCRF的模型来进行命名实体识别任务的训练。模型结构如下： nn.Embedding -> nn.LSTM -&…

阅读更多...

前端练习小项目——方向感应名片

前端练习小项目——方向感应名片

前言：在学习完HTML和CSS之后，我们就可以开始做一些小项目了，本篇文章所讲的小项目为——方向感应名片 ✨✨✨这里是秋刀鱼不做梦的BLOG ✨✨✨想要了解更多内容可以访问我的主页秋刀鱼不做梦-CSDN博客在开始学习之前，先让我们看一…

阅读更多...

C++客户端Qt开发——开发环境

C++客户端Qt开发——开发环境

一、QT开发环境 1.安装三个部分 ①C编译器（gcc，cl.exe……) ②QT SDK SDK-->软件开发工具包比如，windows版本QT SDK里已经内置了C的编译器（内置编译器是mingw，windows版本的gcc/g） ③QT的集成开发…

阅读更多...

KnoBo：医书学习知识，辅助图像分析，解决分布外性能下降和可解释性问题

KnoBo：医书学习知识，辅助图像分析，解决分布外性能下降和可解释性问题

KnoBo：从医书中学习知识，辅助图像分析，解决分布外性能下降问题提出背景KnoBo 流程图KnoBo 详解问题构成结构先验瓶颈预测器参数先验解法拆解逻辑链对比 CLIP、Med-CLIPCLIPMed-CLIPKnoBo 训练细节预训练过程OpenCLIP的微调构建医学语料库文…

阅读更多...

说说执行一条查询SQL语句时，期间发生了什么？

说说执行一条查询SQL语句时，期间发生了什么？

执行一条查询SQL语句时，期间发生了什么？ 前言说说执行一条查询SQL语句时，发生了什么？连接器权限验证断开连接长连接查询缓存查询缓存的问题解析器词法分析语法分析执行 SQL预处理器优化器执行器主键索引查询全表扫描索引下推总…

阅读更多...

轻薄鼠标的硬核选购攻略，很多人都在“高性价比”鼠标上栽跟头了

轻薄鼠标的硬核选购攻略，很多人都在“高性价比”鼠标上栽跟头了

轻薄款设计的鼠标是目前鼠标市场的出货大头， 也是价格最卷的一类鼠标。比游戏鼠标或许更卷一些。这和当前的移动办公趋势关系很大。这类鼠标主要跟笔记本和iPad搭配。核心的使用场景是办公。因此轻薄和静音是这类鼠标的核心卖点。同时用户并不愿意付出太…

阅读更多...

代码随想录算法训练营第三十二天|1049.最后一块石头的重量II、494.目标和、474.一和零

代码随想录算法训练营第三十二天|1049.最后一块石头的重量II、494.目标和、474.一和零

1049.最后一块石头的重量II 有一堆石头，每块石头的重量都是正整数。每一回合，从中选出任意两块石头，然后将它们一起粉碎。假设石头的重量分别为 x 和 y，且 x < y。那么粉碎的可能结果如下： 如果 x y，那…

阅读更多...

期货交易记录20240713

期货交易记录20240713

文章目录期货交易系统构建步骤一、选品二、心态历练三、何时开仓3.1、开仓纪律3.2、开仓时机3.3、开仓小技巧四、持仓纪律五、接下来的计划 2024年7月13号，期货交易第5篇记录。交易记录：半个月多没记录了，这段时间分别尝试做了菜粕、棕榈油…

阅读更多...

9.6 栅格图层符号化唯一值着色渲染

9.6 栅格图层符号化唯一值着色渲染

文章目录前言多波段彩色渲染唯一值着色QGis设置为唯一值着色二次开发代码实现唯一值着色总结前言介绍栅格图层数据渲染之唯一值着色渲染说明：文章中的示例代码均来自开源项目qgis_cpp_api_apps 多波段彩色渲染唯一值着色以“with_color_table.tif”数据为例…

阅读更多...

【嵌入式DIY实例-ESP8266篇】-LCD ST7789显示DS1307 RTC时间数据

【嵌入式DIY实例-ESP8266篇】-LCD ST7789显示DS1307 RTC时间数据

LCD ST7789显示DS1307 RTC时间数据文章目录 LCD ST7789显示DS1307 RTC时间数据1、硬件准备与接线2、代码实现本文将介绍如何使用 ESP8266 NodeMCU 板和 DS1307 RTC 集成电路构建简单的实时时钟和日历 (RTCC)，其中时间和日期打印在 ST7789 TFT 显示模块上。 ST7789 TFT 模块包…

阅读更多...

Open-TeleVision——通过VR沉浸式感受人形机器人视野：兼备远程控制和深度感知能力

Open-TeleVision——通过VR沉浸式感受人形机器人视野：兼备远程控制和深度感知能力

前言 7.3日，我司七月在线(集AI大模型职教、应用开发、机器人解决方案为一体的科技公司)的「大模型机器人(具身智能)线下营」群里的一学员发了《Open-TeleVision: Teleoperation with Immersive Active Visual Feedback》这篇论文的链接，我当时快速看了一…

阅读更多...

UML/SysML建模工具更新情况（2024年7月）（1）

UML/SysML建模工具更新情况（2024年7月）（1）

DDD领域驱动设计批评文集做强化自测题获得“软件方法建模师”称号《软件方法》各章合集工具最新版本：Enterprise Architect 17.0 BETA 更新时间：2024年7月2日工具简介性价比很高，目前最流行的UML建模工具。还包含需求管理、项目估算…

阅读更多...

AIGC专栏13——ComfyUI 插件编写细节解析-以EasyAnimateV3为例

AIGC专栏13——ComfyUI 插件编写细节解析-以EasyAnimateV3为例

AIGC专栏13——ComfyUI 插件编写细节解析-以EasyAnimateV3为例学习前言什么是ComfyUI相关地址汇总ComfyUIEasyAnimateV3 节点例子复杂例子-以EasyAnimateV3为例节点文件必要库的导入载入模型节点定义Image to Video节点定义节点名称映射 __init__.py文件插件导入comfyUI 学习前…

阅读更多...

被动的机器人非线性MPC控制

被动的机器人非线性MPC控制

MPC是一种基于数学模型的控制策略，它通过预测系统在未来一段时间内的行为，并求解优化问题来确定当前的控制输入，以实现期望的控制目标。对于非线性系统，MPC可以采用非线性模型进行预测和优化，这种方法被称为非线性模型…

阅读更多...

JS实现：统计字符出现频率/计算文字在文本中的出现次数

JS实现：统计字符出现频率/计算文字在文本中的出现次数

要实现这个功能，JavaScript 一个非常强大的方法，那就是reduce() reduce() 它用于将数组的所有元素减少到一个单一的值。这个值可以是任何类型，包括但不限于数字、字符串、对象或数组。 reduce() 方法接收一个回调函数作为参数，这个…

阅读更多...

【C++】设计一套基于C++与C#的视频播放软件

【C++】设计一套基于C++与C#的视频播放软件

在开发一款集视频播放与丰富交互功能于一体的软件时，结合C的高性能与C#在界面开发上的便捷性，是一个高效且实用的选择。以下，我们将概述这样一个系统的架构设计、关键技术点以及各功能模块的详细实现思路。一、系统架构设计 1. 架构概览 …

阅读更多...

截图神器Snipaste

截图神器Snipaste

这是我作为测试这么些年来用过的最好用的截图工具，让你将截图贴回到屏幕上，最好用的截图工具，推荐给同事深受好评。 snipaste是一个简单但强大的截图工具，也可以让你将截图贴回到屏幕上。下载打开Snipaste,按下F2来开始截图&…

阅读更多...

推荐文章

最新文章