重塑认知科学中的“行为”理解,提升智能体决策能力

news2024/11/23 20:59:45

编者按:随着科技的不断进步,人工智能与认知科学的交叉研究已成为推动科学前沿的重要力量。其中,习惯性行为与目标导向行为的相互作用是心理学、认知神经科学和人工智能等领域都十分关注的研究课题,因为从简单的日常习惯到复杂的决策制定过程,都是这两种行为模式交互的体现。为了更好地理解二者间的关系,微软亚洲研究院的研究员们通过引入贝叶斯“意图”变量,将习惯性行为与目标导向行为进行了整合,达到了计算效率和灵活性的平衡。该研究的提出不仅挑战了传统的认知模型,也为未来智能系统的设计提供了新的发展方向。相关论文已在《自然-通讯》(Nature Communications)杂志上发表。


在心理学、认知神经科学和人工智能等领域,理解并建模人类与动物的行为是一项持续的挑战。这项研究中最有趣的方面之一,便是习惯性行为(habitual behavior)和目标导向行为(goal-directed behavior)之间的相互作用。从人们日常工作生活的简单习惯,到有规划的、复杂的决策制定过程,无不体现着两种行为模式间的交互。传统观念认为,这些行为由大脑中的两个独立系统管理:习惯性行为迅速且自动化,不需要考虑后果;而目标导向行为则缓慢且灵活,会考虑此行为的后果。

图1:习惯性行为(专注工作时吃零食)和目标导向行为(计划一顿减肥餐)的不同特征

图1:习惯性行为(专注工作时吃零食)和目标导向行为(计划一顿减肥餐)的不同特征

然而,微软亚洲研究院与冲绳科学技术大学院大学的研究者们近期通过变分贝叶斯(variational Bayes)方法,提出了一个新颖的理论框架,挑战了传统观点,将习惯性行为和目标导向行为这两种看似相互独立的行为进行了整合。该框架为在机器学习和人工智能领域设计更高效且适应性强的系统提供了新的思路,同时也将有助于人们进一步了解神经系统的机理。相关论文已在《自然-通讯》(Nature Communications)杂志上发表。

Synergizing Habits and Goals with Variational Bayes

论文链接:https://www.nature.com/articles/s41467-024-48577-7

习惯性行为和目标导向行为间的协同作用

微软亚洲研究院的研究员们所提出的贝叶斯行为(Bayesian Behavior)框架,使用变分贝叶斯方法建模了感知运动任务中的行为,其中的核心创新点就在于引入了一个贝叶斯“意图”(intention)变量,从而有效地将习惯性行为与目标导向行为进行了衔接。习惯性行为由感官输入计算的意图先验分布驱动,无需具体目标。目标导向行为则由一个通过最小化变分自由能推断(active inference)的目标条件意图后验分布的引导。

研究员们认为,习惯性行为和目标导向行为不应被独立对待。相反,这些行为共享神经路径,且可以互相借鉴补充。例如,习惯性行为虽然缺乏灵活性,但可通过练习来提供熟练的运动技能,目标导向行为此时便可以利用这些技能进行更复杂的任务规划。这种协同方法可通过以下两种机制实现:(1)最小化先验(习惯性)和后验(目标导向)意图之间的差异;(2)先通过逆方差加权平均将先验和后验意图结合成一个协同意图,然后智能体(agent)再使用该意图与环境进行互动。

图2:(a) 贝叶斯行为框架概述;(b)和(c) 学习过程中和行为过程中的框架图

图2:(a) 贝叶斯行为框架概述;(b)和(c) 学习过程中和行为过程中的框架图

模拟实验:智能体行为模式的转变、调整与零样本规划能力

研究员们通过在视觉引导的感知运动任务中的模拟实验对贝叶斯行为框架进行了测试,该实验采用的是T形迷宫(T-maze)环境。实验结果显示,贝叶斯行为框架所得出的结论与神经科学和心理学实验的观察数据相吻合:

1. 从目标导向到习惯性行为的过渡:模拟实验结果表明,在反复学习同一任务的过程中,智能体的行为会自动地从缓慢的目标导向行为转变为更快的习惯性行为。这一过渡是由习惯性意图的精确性的增加引起的,从而减少了目标导向规划的计算负担。

2. 奖励贬值后的行为变化:模拟实验还探讨了智能体在奖励结果变化时,如何调整其行为,这与心理学中的结果贬值(outcome devaluation)的情境相似。经过更大量的训练,智能体在习惯性行为方面表现出了更强的顽固性。

3. 零样本(zero-shot)目标导向规划:该框架展示了智能体处理新目标而无需额外训练的能力。通过利用现有的习惯性行为,智能体能够有效地规划和执行新任务。

图3:经过训练的智能体 (a-c) 可以针对未见过的目标 (d, e) 执行目标导向的规划(例如看见更多的蓝色)

图3:经过训练的智能体 (a-c) 可以针对未见过的目标 (d, e) 执行目标导向的规划(例如看见更多的蓝色)

认知神经科学视角下的智能体决策机制

智能体在面对复杂任务时,会通过内部模型来预测和规划行为。这些模型基于智能体对环境的理解和先前经验的积累,使其能够在不断变化的环境中做出适应性决策。那么,习惯性行为和目标导向行为之间的动态交互是如何实现的?智能体的行为模式和决策过程又是如何运作的?

研究员们从认知神经科学和人工智能的交叉研究视角出发,给出了见解:

智能体如何在无模型的习惯性行为和基于模型的目标导向行为之间进行取舍?

研究员们提出,智能体通过逆方差加权平均将先验和后验意图,结合成一个协同意图。该方法通过意图分布的统计方差,能够自然地衡量行为的不确定性。同时,该方法允许智能体在训练过程中最小化自由能和强化学习损失动态,从而可以自主地调整这一平衡。

智能体如何通过重复试验,从缓慢的目标导向行为自主过渡到快速的习惯性行为?

模拟实验结果表明,在适应新任务时,习惯性意图的方差最初很大,但由于无模型决策的简单性,该方差将伴随重复试验的增加而减少。随着训练的进展,方差的减少将使得平衡逐渐倾向于习惯性意图。研究员们还引入了一种机制,可以在协同意图足够精确时,让智能体提前停止目标导向的主动推理,节省计算资源,同时保持高行为精度。这一发现解释了为什么在广泛的训练过程中,智能体会从目标导向行为转变为习惯性行为。

智能体如何为未经过训练的新目标执行目标导向的规划?

智能体应配备一个内部预测模型(world model),通过预测模型来搜索并规划目标导向意图。目标导向意图是在习惯性意图的约束下进行推断的。这一约束确保了目标导向规划的有效性(不去搜索一些不习惯的行为),并且利用了在习惯性意图和共享策略网络中形成的底层运动技能。该框架使得智能体能有效地将目标导向性行为泛化到新目标。

探索智能体行为的计算框架新范式

微软亚洲研究院贝叶斯行为框架的研究标志着人们对认知科学意义上的“行为”的理解有了新的突破。研究员们通过贝叶斯行为框架整合习惯性和目标导向行为,构建了一个能平衡效率和灵活性的全面模型。这项研究不仅推动了相关理论知识的发展,还为人工智能和机器人技术的实际应用提供了新的思路。例如,将强化学习与主动推理相结合,可以增强自主智能体在复杂环境中的决策能力。此外,理解习惯性和目标导向行为之间的相互作用不仅有助于揭示神经系统的机理,还能为相关疾病的治疗策略提供指导。随着对认知科学和人工智能的不断探索,微软亚洲研究院的研究员们将会继续在跨学科研究中发挥创新思维的力量。

注:经过作者允许并基于 Creative Commons Attribution 4.0 International License (https://creativecommons.org/licenses/by/4.0/),本文复用原论文中部分图片。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1797945.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

linux 开放mysql端口

问题 在配置mysql后,需要放开3306端口,出现了FirewallD is not running错误 [roothadoop102 mysql]# firewall-cmd --zonepublic --add-port3306/tcp --permanent FirewallD is not running 1.启动firewalld systemctl start firewalld 2.查看firew…

算法 java 排序和查找

排序和查找 冒泡排序(稳定)选择排序(不稳定)插入排序(稳定)希尔排序(不稳定)归并排序(稳定)快速排序(不稳定)堆排序计数排序桶排序基数…

医诊合作怎么避免减少双方损失,吸引更多的优质医疗资源下沉到基层?防漏费系统又起到什么作用?

健康领域的现代化治理要求在公共医疗卫生机构之间建立合作关系,然而我国公共医疗卫生服务领域呈现各级各类健康服务机构自由混合竞争的格局,这对公医分类分级诊疗法治秩序构成全面挑战,并成为影响转诊制度构建的重要因素.我国转诊制度的建设应以维护诊疗合作的法律秩序为前提,并…

动态内存管理(malloc,calloc,realloc,free)+经典笔试题

动态内存管理 一. malloc 和 free1. malloc2. free 二. calloc三. realloc四.动态内存的错误1.对NULL指针的解引用操作2.对动态开辟空间的越界访问3.对非动态开辟内存使用free释放4.使用free释放一块动态开辟内存的一部分5.对同一块动态内存多次释放6.动态开辟内存忘记释放&…

LabVIEW液压伺服压力机控制系统与控制频率选择

液压伺服压力机的控制频率是一个重要的参数,它直接影响系统的响应速度、稳定性和控制精度。具体选择的控制频率取决于多种因素,包括系统的动态特性、控制目标、硬件性能以及应用场景。以下是一些常见的指导原则和考量因素: 常见的控制频率范…

Docker容器技术原理

深入剖析Linux容器 Docker本质是宿主机上的进程,通过namespace实现资源隔离,通过cgroups实现资源限制 docker深度学习-github Docker技术原理 Docker 是利用 Linux 的 Namespace 、Cgroups 和联合文件系统三大机制来保证实现的, 所以它的原…

AI和机器人引领新一轮农业革命

AI和机器人技术在农业领域的应用正在迅速发展,未来它们可能会实现厘米级精度的自主耕作。 精确种植:AI算法可以分析土壤条件、气候数据和作物生长周期,以决定最佳种植地点和时间。 土壤管理:利用传感器和机器学习,机器…

TEE的密码学算法都支持哪些?你们都是如何实现的?

先说TEE OS中都支持哪些密码学算法?需要支持哪些密码学算法? 我们从GP规范的角度来看。在一般的tee中,都号称支持GP规范。GP规范里要求的强制支持的算法,一般都会实现。对于GP规范里可选的算法,并不是每一家TEE都能支持的。 强制要求的算法 可选支持的算法有 再来看TEE O…

python pip 安装

如果您不确定pip的安装路径,可以通过以下命令来查询: pip show pip 这个命令会显示pip的详细信息,其中包括pip安装的路径。如果您想修改pip的默认安装路径,可以使用pip的"--target"参数指定目标路径,例如&a…

堡垒机的自动化运维,快速安全提升运维效率

随着信息技术的突飞猛进,企业对于IT系统的依赖程度日益加深,不仅希望可以提高运维效率,也希望能保障IT系统的安全。因此堡垒机与自动化运维技术的结合应运而生,堡垒机的自动化运维,快速安全提升运维效率。今天我们就来…

Android 绑定服务的5个问题。

1.android studio 目录结构改变了。为什么会报R 资源文件找不到。 在写项目的时候经常需要改到。 gradle文件里的域名名字要改变下。 2.Caused by: android.app.BackgroundServiceStartNotAllowedException: Not allowed to start service Intent { cmpcom.zjtzsw.sbkDevice/…

Arthas使用教程——JVM常用命令

JVM相关命令 dashboard——当前系统的实时数据面板 显示当前 tomcat 的实时信息。 使用方式:dashboard 数据说明 ID: Java 级别的线程 ID,注意这个 ID 不能跟 jstack 中的 nativeID 一一对应。 NAME: 线程名 GROUP: 线程组名 PRIORITY: 线程优先级…

探索多头混合专家(MH-MoE)模型的先进架构

在深度学习领域,大型模型如大型语言模型(LLMs)和大型多模态模型(LMMs)因其在各个领域的有效性而受到广泛关注。然而,这些模型在训练和推理时面临着巨大的计算成本。为了解决这一问题,研究者们提…

【Python】深入认识Python数据类型和变量

​​​​ 文章目录 1. 引言数据类型的重要性Python中的数据类型概述 2. 数字类型整型(int)浮点型(float)复数(complex) 3. 字符串类型字符串的定义与使用字符串操作方法 4. 布尔类型布尔值和布尔运算 5. 列…

【RK3568】制作Android11开机动画

Android 开机 logo 分为两种:静态显示和动态显示。静态显示就是循环显示一张图片;动态显示就是以特定帧率顺序显示多张图片 1.准备 android logo 图片 Android logo最好是png格式的,因为同一张图片的情况下,png 格式的比 jpg和b…

kafka命令--简单粗暴有效

zookeeper bin目录下执行 启动:./zkServer.sh start 停止:./zkServer.sh stop 重启:./zkServer.sh restart 状态:./zkServer.sh status kafka bin目录下执行 启动:./kafka-server-start.sh -daemon …/config/server.…

三款强大的Node.js版本控制工具推荐

在Web开发领域,Node.js无疑是一个热门的JavaScript运行时环境,它允许开发者使用JavaScript来构建服务器端应用程序。随着Node.js版本的不断更新,管理多个Node.js版本变得尤为重要。以下是三款实用的Node.js版本管理工具,它们可以帮…

VS2015安装模块时报错:安装包丢失或损坏,,,,,无效的驱动器

解决: 1、解压.iso文件; 2、替换目录 替换为解压后的对应的目录,点击重试即可。

二说springboot3的自动配置机制

大家好,这里是教授.F 目录 SpringBootApplication: EableAutoConfiguration: 上一篇文章粗略的讲了自动配置机制,二说系列将从源码的角度进行讲解。 SpringBootApplication: 首先我们还是得从SpringBootApplication…

大数据之HDFS磁盘扩容(linux磁盘扩容)

之所以扩容,是因为当前大数据平台已经接入了不同来源的数据,当执行mapreduce任务时,会发生磁盘爆满,导致hdfs爆红 具体扩容方案如下: 1、查看云磁盘分区情况 fdisk -l . 可以从图看出: /dev/vda 数据盘磁盘容量为21.5GB,包含/dev/vda1分区 /dev/vdb 数…