让ChatGPT等模型学会自主思考!开创性技术“自主认知”框架

news2024/11/25 20:52:08

ChatGPT、百度文心一言、Bard等大语言模型展现出了超强的创造能力,加速了生成式AI的应用进程。但AI模型只能基于训练数据执行各种任务,无法像人类一样利用生活知识、过往经验用于复杂的推理和决策。

例如,在玩游戏时,人类可以利用各种线索、常识、经验以及对游戏规则的理解做出最佳决策。而AI只能通过大量训练学习游戏的模式,不具备人性化理解功能。一旦游戏规则或环境发生变化,AI就很难做出正确的选择。

为了解决这些难题,克莱姆森大学AI实验室提出了自主认知技术框(Autonomous Cognitive Entity,简称“ACE”)。通过道德、全局战略、代理模型、执行、认知控制和任务执行6大分层设计,使AI模型可以实现“自主决策”和道德推理的认知架构。

长期以来,让AI模型具备“常识推理”的能力一直是科研界的重中之重。而ACE框架被视为解决这个难题的创新性突破研究。

其实ACE概念与前不久中国科学院自动化研究所和耶鲁大学提出的“思维传播”技术框架类似,都是让大模型学会利用过往经验增强复杂推理能力来处理全新的问题,只不过推理分层更加具体化,并加入了道德规范的限制保证输出内容的安全性。

论文地址:https://arxiv.org/abs/2310.06775
在这里插入图片描述

ACE技术框架得到了业界众多技术大牛的认可。斯坦福大学计算机科学系教授John Etchemendy表示,ACE框架标志着人工智能研究的新范式,其分层抽象和信息反馈的设计对实现人工常识推理大有帮助。

麻省理工AI实验室主任Daniela Rus认为,ACE框架构建了一个集成伦理、认知和计算原理的完整结构,为人工常识推理提供了新的研究方向。

ACE框架的总目标是实现一种既高能又伦理的人工智能系统。其核心创新在于融合了顶层的抽象伦理推理与底层的具体任务实现,构建一个闭环完整的认知体系。

ACE主要由道德、全局战略、代理模型、执行、认知控制和任务执行6大层组成,每一层集中处理不同的功能,高层处理抽象推理,低层负责具体任务执行。

在这里插入图片描述

道德层

最高的道德层确定了整个系统的方向和原则, 其功能是定义一个自治代理的核心价值观和伦理原则,包含3部分。

(1)基本伦理准则:这是直观的道德准则,为系统提供基本遵循。

(2)次要原则:诸如人权义务等提供具体指导。

(3)使命宣言:定义代理的核心目标和意图。

全局战略层

在接收到来自道德层的抽象使命后,全局战略层会结合具体情境,制定实现这些使命的长期计划,包含2部分。

(1)情境融合:吸收环境信息,理解代理面临的具体情境。

(2)战略文件:产出指导性文件,为下层提供行动指南。

在这里插入图片描述

代理模型层

致力于理解一个代理在给定环境下的能力参数、系统结构、限制条件等,构建一个“自我模型”为决策提供依据,包含4部分。

(1)运行参数:通过监测获得的遥测数据。

(2)配置信息:软硬件架构、版本等。

(3)能力范围:可以完成和不能完成的事项。

(4)局限性:只能在特定条件下工作的约束。

执行功能层

执行功能层扮演“项目经理”的角色,将来自高层的战略使命转化为明确的计划路线图。路线图提供所有具体的执行步骤,同时考虑资源分配和风险管理,使战略落地,包含4部分。

(1)定义任务步骤:将战略任务分解为细粒度操作。

(2)设置检查点:定义重要的中间结果以验收进展。

(3)分配资源:优化资源使用以保证计划顺利执行。

(4)评估风险:预测可能的问题并提前规划应对措施。

在这里插入图片描述

认知控制层

认知控制层扮演“任务管理”的角色,会根据当前环境和反馈动态选择和调度合适的任务,包含4部分。
在这里插入图片描述

(1)任务选择:根据优先级、环境等选择下一个任务。

(2)任务切换:在任务间流畅切换以优化订单。

(3)挫折感知:如果任务重复失败会产生主动变更。

(4)内部调节:思考不同选择的利弊。

任务执行层

最后的任务执行层直接与环境交互,执行由认知控制层下达的特定任务。根据任务类型,可以调用API接口、控制机械装置、进行对话等,包含3部分。

(1)数字通信:使用编程语言和接口调用实现数字任务

(2)物理协同:控制机器人和传感器完成物理任务

(3)结果监测:比较结果与预期,发送成功或失败反馈

这种分工明确的多层设计有诸多好处:第一,不同层级可以同时并行工作,提升了效率;第二,分层的封装和信息隐藏增强了系统的安全性和可解释性;

第三,分层使系统可以模块化迭代升级,而不需要全重构;第四,高层可以监控低层的运行, 当Einmal出现偏差可以进行修正,保证系统的可控性。

在这里插入图片描述

此外,ACE框架的另一个创新在于巧妙利用了当前热门的大语言模型,例如,ChatGPT、Bard等。

这些模型通过学习海量文本数据,已经展现了接近人类的语言理解和语言生成能力。ACE框架将语言层面融入每个层级,使语言模型不再单独运行,而是成为支撑整个认知架构的关键组件。

从道德层到任务层,语言模型帮助理解抽象概念,进行策略推理,建立自我模型,甚至最终控制机器人执任务的方式都是语言化的。

这种融合为语言模型提供了明确的上下文和指导,让其生成的输出更加准确,避免了“自说自话”的问题。

这也表明,大语言模型也可以在系统级扮演重要角色,而不仅仅是完成单个语言任务。ACE框架展示了如何更好地利用大语言模型的潜力,将其打造为推动认知发展的核心引擎,为人工常识推理提供动力。

本文素材来源克莱姆森大学论文,如有侵权请联系删除

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1090452.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

mysql中的几种排名函数

mysql中的排名函数 mysql里面的排名函数&#xff0c;涉及有以下几个&#xff1a; rank()、dense_rank()、row_number() 1、rank() 函数 RANK() OVER (PARTITION BY <expression>[{,<expression>...}]ORDER BY <expression> [ASC|DESC], [{,<expression…

如何用 ChatGPT 的 Advanced Data Analysis 帮你采集数据?

&#xff08;注&#xff1a;本文为小报童精选文章&#xff0c;已订阅小报童或加入知识星球「玉树芝兰」用户请勿重复付费&#xff09; 想采集网页数据却不会写 Python 爬虫&#xff1f;不会就不会吧&#xff0c;ChatGPT 会就可以了 &#x1f602; 问题描述 朋友最近遇到了一点儿…

thinkphp6 获取url路径中的应用名、控制器名、操作名

如果使用了多应用模式&#xff0c;可以通过下面的方法来获取当前应用 app(http)->getName(); 获取当前控制器 Request::controller(); 获取当前操作 Request::action(); 请求信息 ThinkPHP6.0完全开发手册 看云 ThinkPHP6.0基于精简核心和统一用法两大原则在5.1的基础上…

Ansible基础及模块

Ansible是一个基于Python开发的配置管理和应用部署工具&#xff0c;能批量配置、部署、管理上千台主机。比如以前需要切换到每个主机上执行的一或多个操作&#xff0c;使用Ansible只需在固定的一台Ansible控制节点上去完成所有主机的操作 Ansible是基于模块工作的&#xff0c;它…

JZ64 求1+2+3+...+n

JZ64 求123…n //实例化对象时会自动调用构造函数 class Solution { public:class Sum{public://每调用一次构造函数 _sum加等一个数Sum(){_sum _i;_i;}};//Solution类的成员函数int Sum_Solution(int n){_i 1;_sum 0;//数n是几 我就构造几个对象//构造几个对象就会调用…

SVN报错fail to run the WC Db work queue associated with,清理失败,乱码的解决方式

替换掉 wc.db 文件即可 SVN报错fail to run the WC Db work queue associated with&#xff0c;清理失败&#xff0c;乱码的解决方式_svn failed to run the wc db-CSDN博客

Kubernetes 集群部署 Prometheus 和 Grafana

Kubernetes 集群部署 Prometheus 和 Grafana 文章目录 Kubernetes 集群部署 Prometheus 和 Grafana一.部署 node-exporter1.node-exporter 安装2.部署 node-exporter 二.部署Prometheus1.Prometheus 安装和配置&#xff08;1&#xff09;创建 sa 账号&#xff0c;对 sa 做 rbac…

智能物联网解决方案:蓝牙IOT主控模块打造高效监测和超低功耗

物联网蓝牙模块&#xff0c;无论单模&#xff0c;还是双模&#xff0c;或者双模音频的选择&#xff0c;如下文说描述&#xff1a; 蓝牙芯片模块市场的百花齐放&#xff0c;也带来的工程师在选型时碰到很大的困难&#xff0c;但是无论是做半成品&#xff0c;还是做成品&#xf…

Java GC 算法

一、概述 理解Java虚拟机垃圾回收机制的底层原理&#xff0c;是成为一个高级Java开发者的基本功。本文从底层的垃圾回收算法开始&#xff0c;着重去阐释不同垃圾回收器在算法设计和实现时的一些技术细节&#xff0c;去探索「why」这一部分&#xff0c;通过对比不同的垃圾回收算…

BAT020:将文本文档中多行文本拼接为;分隔的单行文本

引言&#xff1a;编写批处理程序&#xff0c;实现将文本文档中多行文本拼接为;分隔的单行文本。 一、新建Windows批处理文件 参考博客&#xff1a; CSDNhttps://mp.csdn.net/mp_blog/creation/editor/132137544 二、写入批处理代码 1.右键新建的批处理文件&#xff0c;点击【…

[软考中级]软件设计师-uml

事物 uml中有4中事物&#xff0c;结构事物&#xff0c;行为事物&#xff0c;分组事物和注释事物 结构事物是uml模型中的名词&#xff0c;通常是模型的静态部分&#xff0c;描述概念或物理元素 行为事物是uml的动态部分&#xff0c;是模型中的动词&#xff0c;描述了跨越时间…

记一次Hbase2.1.x历史数据数据迁移方案

查看待迁移的表 list_namespace_tables vaas_dwm2. 制作待迁移表“DWM_TRIP_PART”的快照 snapshot vaas_dwm:DWM_TRIP_PART,dwm_trip_part_snapshot3. 统计待迁移表数据总数 hbase org.apache.hadoop.hbase.mapreduce.RowCounter vaas_dwm:DWM_TRIP_PART

phantom3D模体

phantom是人头模型&#xff0c;分为2D和3D两种&#xff0c;matlab中可直接调用phantom(size)生成2D数据&#xff0c;如图1&#xff0c;而三维需要对应函数文件&#xff0c;下载&#xff1a;3D 图1 2D phantom 3D模体为一个椭球体&#xff0c;只能生成xyz三个方向相同维度的模…

2023年东数西算研究报告

第一章 行业概况 1.1 定义 “东数西算”是近年来在中国大数据和数据中心领域中引起广泛关注的一个概念&#xff0c;其背后的理念与国家级的资源优化配置战略紧密相连。这一概念是“全国一体化大数据中心协同创新体系”下的一个重要组成部分。该创新体系旨在推进技术、业务、数…

pdf压缩文件怎么压缩最小?pdf压缩方法汇总

PDF是一种常见的文件格式&#xff0c;通常用于电子文档和印刷品&#xff0c;由于PDF文件通常包含大量的元数据、字体、图像和其他元素&#xff0c;因此它们的大小可能会非常大。 为了解决这个问题&#xff0c;我们可以使用一些PDF压缩工具来帮助我们&#xff0c;以便我们能够更…

Springcloud笔记(2)-Eureka服务注册中心

Eureka服务注册 Eureka作为一个微服务的治理中心&#xff0c;它是一个服务应用&#xff0c;可以接收其他服务的注册&#xff0c;也可以发现和治理服务实例。 服务治理中心是微服务&#xff08;分布式&#xff09;架构中最基础和最核心的功能组件&#xff0c;它主要对各个服务…

强缓存和协商缓存

强缓存和协商缓存 缓存分为强缓存和协商缓存。强缓存不过服务器&#xff0c;协商缓存需要过服务器&#xff0c;协商缓存返回的状态码是304。两类缓存机制可以同时存在&#xff0c;强缓存的优先级高于协商缓存。当执行强缓存时&#xff0c;如若缓存命中&#xff0c;则直接使用缓…

京东数据平台:2023年9月京东洗衣机行业品牌销售排行榜

鲸参谋监测的京东平台9月份洗衣机市场销售数据已出炉&#xff01; 9月份洗衣机行业销售呈下滑状态。鲸参谋数据显示&#xff0c;9月京东平台洗衣机的总销量为116万&#xff0c;环比下滑约1%&#xff0c;同比下滑约13%&#xff1b;月销售额为17亿&#xff0c;环比下滑约7%&…

【漏洞复现】安全云平台存在任意文件下载getshell

漏洞描述 深圳市强鸿电子有限公司鸿运主动安全云平台存在任意文件下载漏洞,攻击者可通过此漏洞下载敏感文件信息。 免责声明 技术文章仅供参考,任何个人和组织使用网络应当遵守宪法法律,遵守公共秩序,尊重社会公德,不得利用网络从事危害国家安全、荣誉和利益,未经授权…

SQL Server修改表结构

在SQL Server中修改的关键字是 ALTER(改变;(使)更改;修改(衣服使更合身);改动&#xff09; 列操作 添加列 添加列操作 alter tabel 表名 add 列名 数据类型--给员工表添加一个邮箱 alter的翻译是&#xff08;改变&#xff09; alter table people add PeopleMail varchar(2…