学术前沿|通研院提出首个“对称现实”框架,探索智能时代人机共生新范式

news2024/11/19 20:17:44

人类正在迈入智能时代,其中一个显著特征是大量智能体的涌现。无论生物人、数字人和机器人,都是智能体的不同具身形式。为实现多种智能体在跨虚实空间的共存协作,探索人机共生的新范式,北京通用人工智能研究院(简称通研院)在IEEE VR 2024上发表了题为《On the Emergence of Symmetrical Reality》的论文,并作口头报告。

Image

文章创新性地提出了全球首个对称现实框架,用于描述各种物理-虚拟融合形式下的人机共生形态。该框架系统地分析了物理-虚拟融合的不同技术范式,深入阐述了人工智能体(特别是未来具备类人感知认知能力、能够自主决策的通用智能体)融入人类社会的各种挑战,并开发了一个原型系统以探索对称现实框架在特定任务中的具体实践路径。

该工作的论文链接、项目主页如下:

论文链接: https://arxiv.org/pdf/2401.15132.pdf

项目主页: https://sites.google.com/view/ieeevr2024sr

公众号原文链接:

学术前沿|通研院提出首个“对称现实”框架,探索智能时代人机共生新范式

Image

01 导 言

对称现实是描述人与智能体在跨虚实空间共生协作的一种理论框架,解释了AI技术高速发展所带来的新型的人机共存关系。在这个框架内,人工智能(AI)被视为原生于数字虚拟空间(或称虚拟世界)内的一种数字生命,人工智能驱动的智能体(AI Agents)则可以同时在物理世界和虚拟世界拥有各种具身形态,可具备自主的感知、认知、决策、学习、执行和社会协作能力。因此,这种智能体在感知交互结构方面,能够与人的感知交互过程相类比。这就使得智能体在存在形式、交互形态上,可以拥有与人类等同的逻辑结构。也就是说,物理世界的人类和虚拟世界的智能体,都可以在物理、虚拟世界中同时执行任务,在一定程度上形成了对称。我们将这种人机对称式存在及交互系统所呈现的现象称为对称现实(Symmetrical Reality)。

02 基本架构

Image

图1 对称现实系统拓扑结构示意图

对称现实系统中,人和智能体分属于不同的空间,但是均可在虚、实空间内活动。物理世界和虚拟世界可以看作是不同的存在形式。人类和其所生活的物理世界属于同质的(Homogeneous),但是人类和虚拟世界属于异质的(Heterogeneous) 。同理,智能体的智能一般形成于数字虚拟空间,因此智能体和虚拟世界属于同质的,但是和物理世界却属于异质的。这种本质的不同,也导致了人类和智能体(尤其是具有较高智能水平的自主智能体)在共存协作中具有迥异的表现。

03 人类兼容的AI

Image

图2 对称现实框架中的人和智能体需求示意图

谈到人机共存,一般我们会想到从需求理论出发去探讨人机之间的关系。这里我们不妨采用马斯洛的需求层次理论来描述人类需求体系,当然这并不是唯一的方式。与之对应,我们同样可以设计一个多层次的AI需求层次体系来建模智能体在人机交互中的表现。假设智能体首要的需求是能够生存下来,这支持了它可以继续做各种任务;其次是它需要有能力跟外界进行信息交互,或者执行某些动作来改变外部环境;最后,为了与人协作,它需要得到人类的信任,提升协作的表现。据此设计的AI需求层次,参考了马斯洛的分层设计方式,具备一定的典型性。当然在某些情况下,智能体可能并不需要具备需求层次,仅仅完成被编程好的任务即可。但是如果需要将其设计成自主驱动的智能体,那么设计人员便可以按照类似方法,将智能体设计成人类兼容(Human Compatible)的形式,更好地服务人类社会,这种自顶向下的设计方式也可在人机价值对齐中起到重要作用。

04 实例场景

Image

图3 逆向增强现实和逆向虚拟现实

传统的虚拟现实、增强现实都是以人为中心的研究范式,研究目标是为人类构造虚拟的或虚实融合的数字呈现。但是区别于人类的是,智能体本身就是源自于虚拟空间的,那么它对物理、虚拟空间的感知过程会和人类一样吗?这可能需要分类来看。如果仅看其在对称现实系统中的定位,那么它和人类一样,都可以在虚拟和物理空间交互,其感知过程和人类确实可以看成是类似的结构,这也是对称现实的本质特征之一,即双感知主体。但是正如前文提到的,物理世界和虚拟世界是异质的形式,所以对于智能体来说,物理世界反而是一种“remote”的东西,虚拟世界才是“local”的东西。这就决定了,如果用物理世界的元素来增强智能体的体验的话,是一种以智能体为感知中心的增强现实(Augmented Reality)形式,可以称之为逆向增强现实(Inverse Augmented Reality)。同理,以智能体为感知中心的虚拟现实,可以成为逆向虚拟现实。这些都作为对称现实体系的一些具体形式,支撑了对称现实的基本架构。

Image

图4 智能体主动服务模拟

最后,我们模拟了一个智能体为人类提供服务的场景,试图以生活化的案例来说明对称现实的基本应用方式。在该场景中,智能体在虚拟空间和物理空间有着不同的具身形态。当人类主要在物理空间活动时,智能体可以基于自己的观测信号,主动为人类提供服务(如通过机械臂、机器狗等具身组件的协同配合来帮人准备饮料;或者利用无人机这种飞行单元快速寻找家庭成员并发起主动实时通信等)。这里在模拟环境下展示了智能体为人类提供实际帮助的例子,当然,如果人类采用VR设备进入虚拟世界的话,那么虚拟世界的具身就能够以更加多样化的形态在虚拟世界为人类提供帮助,成为虚拟世界中的一个协作伙伴。

05 结 论

总之,对称现实提供了一个全新的视角来看待当下和未来的人机共生形态,也为智能体如何朝着人类兼容的方向发展提供了一个研究范式。在实际应用上,对称现实或许可以为未来的人工智能,尤其是通用人工智能的发展提供一种新思路。例如,通研院提出的首个通用智能人“通通”,在虚拟空间已经具有自主产生任务、主动帮助的能力,未来,可将“通通”的通用底座应用于各类垂直场景,以各种具身智能的形式走进千家万户,赋能千行百业。

/参考文献 /

[1] Nadikattu, R. R. (2016). The emerging role of artificial intelligence in modern society. International Journal of Creative Research Thoughts.

[2] Peng, Y., Han, J., Zhang, Z., Fan, L., Liu, T., Qi, S., ... & Zhu, S. C. (2023). The tong test: Evaluating artificial general intelligence through dynamic embodied physical and social interactions. Engineering.

[3] Lapuschkin, S., Wäldchen, S., Binder, A., Montavon, G., Samek, W., & Müller, K. R. (2019). Unmasking Clever Hans predictors and assessing what machines really learn. Nature communications, 10(1), 1096.

[4] Minsky, M. (1988). Society of mind. Simon and Schuster.

[5] Rahwan, I., Cebrian, M., Obradovich, N., Bongard, J., Bonnefon, J. F., Breazeal, C., ... & Wellman, M. (2019). Machine behaviour. Nature, 568(7753), 477-486.

[6] Zhang, Z., Zhu, Y., & Zhu, S. C. (2020, October). Graph-based hierarchical knowledge representation for robot task transfer from virtual to physical world. In 2020 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS) (pp. 11139-11145). IEEE.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1567044.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Jenkins详细教程(下载安装、构建部署到Linux)

目录 第一章、快速了解Jenkins1.1)Jenkins中一些概念介绍1.2)Jenkins和maven用途上的区别1.3)为什么使用Jenkins 第二章、Winodws下载安装Jenkins2.1)安装之前的准备2.2)Windows中Jenkins下载安装教程2.3)J…

百度行驶证C++离线SDK V1.1 C#接入

百度行驶证C离线SDK V1.1 C#接入 目录 说明 效果 项目 代码 下载 说明 自己根据SDK封装了动态库,然后C#调用。 SDK包结构 效果 项目 代码 using Newtonsoft.Json; using System; using System.Drawing; using System.Runtime.InteropServices; using System…

【Android、 kotlin】kotlin学习笔记

基本语法 fun main(){val a2var b "Hello"println("$ (a - 1} $b Kotlin!")} Variables 只赋值一次用val read-only variables with val 赋值多次用var mutable variables with var Standard output printin() and print() functions String templ…

蓝凌OA单点登录实现方案:以统一身份管理提升效率与安全新举措

蓝凌OA的优势与挑战 在数字化浪潮的推动下,企业对于高效、安全的身份管理需求愈发迫切。蓝凌OA系统,以其出色的流程管理和协同办公能力,已经成为众多企业实现数字化转型的重要工具。然而,随着企业信息化建设的不断深入&#xff0…

2024最新AI创作系统ChatGPT源码+Ai绘画网站源码,GPTs应用、AI换脸、插件系统、GPT文档分析、GPT语音对话一站式解决方案

一、前言 SparkAi创作系统是基于ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统,支持OpenAI-GPT全模型国内AI全模型。本期针对源码系统整体测试下来非常完美,那么如何搭建部署AI创作ChatGPT?小编这里写一个详细图文教程吧。已支持GPT…

微信小程序怎么制作?制作一个微信小程序需要多少钱?

随着移动互联网的快速发展,微信小程序已成为连接用户与服务的重要桥梁。它以其便捷性和易用性,为各类企业和个人提供了一个全新的展示和交易平台。那么,如何制作一个微信小程序?又需要投入多少资金呢?本文将为您提供全…

权限管理系统【BUG】

1.1.简介 忙里偷闲,学点Java知识。越发觉得世界语言千千万,最核心的还是思想,一味死记硬背只会让人觉得很死板不灵活,嗯~要灵活~ 1.2.问题 permission.js:37 [Vue warn]: Error in render: "TypeError: Cannot read prope…

docker部署nacos,单例模式(standalone),使用mysql数据库

文章目录 前言安装创建文件夹"假装"安装一下nacos拷贝文件夹删除“假装”安装的nacos容器生成nacos所需的mysql表获取mysql-schema.sql文件创建一个mysql的schema 重新生成新的nacos容器 制作docker-compose.yaml文件查看网站 前言 此处有本人写得简易版本安装&…

大话设计模式之备忘录模式

备忘录模式是一种行为设计模式,用于在不破坏封装性的前提下捕获对象的内部状态,并在需要时将其恢复到先前的状态。它允许在不暴露对象实现细节的情况下,保存和恢复对象的状态。 以下是备忘录模式的一种常见实现: 备忘录&#xff…

网络基础二——传输层协议UDP与TCP

九、传输层协议 ​ 传输层协议有UDP协议、TCP协议等; ​ 两个远端机器通过使用"源IP",“源端口号”,“目的IP”,“目的端口号”,"协议号"来标识一次通信; 9.1端口号的划分 ​ 0-10…

Windows不常见问题集

● 解决CACLS 禁止修改计算机名 管理员权限运行cmd:cacls %SystemRoot%\System32\netid.dll /grant administrators:f ● Excel 2010 AltTab組合鍵設置 HKEY_CURRENT_USER\Software\Microsoft\Windows\CurrentVersion\Explorer,在該路徑建32字元DWO…

P1102 A-B 数对 (非二分,不开龙永远的痛,用map解决)

可是我真的会伤心 题目链接 思路:1.本来想的是暴力,两层循环模拟每个数。 2.后来想先把每个数字的个数求出来放在数组nums【】中,并把不重复的数字存到数组b,再两层循环b数组应该时间复杂度会好些,如果b数组中的两个数…

如何在 Visual Studio for Mac 中使用 .NET 8 上的 FastReport Avalonia

FastReport Business Graphics .NET,是一款基于fastreport报表开发控件的商业图形库,借助 FastReport 商业图形库,您可以可视化不同的分层数据,构建业务图表以进行进一步分析和决策。利用数据呈现领域专家针对 .NET 7、.NET Core、…

设计模式之命令模式(上)

命令模式 1)概述 1.定义 命令模式(Command Pattern) 将一个请求封装为一个对象,可以用不同的请求对客户进行参数化;对请求排队或者记录请求日志,以及支持可撤销的操作。 2.作用 命令模式可以将请求发送者和接收者完全解耦&am…

京东获得JD商品详情 API 接口(jd.item_get)的详细使用说明,包括如何通过该接口获取商品的基本信息,包括名称、品牌、产地、规格参数等

通过调用京东商品详情API接口,开发者可以获取商品的基本信息,如名称、品牌、产地、规格参数等。此外,还可以获取商品价格信息,包括原价、促销价和活动信息等。同时,该接口还支持获取商品的销量、评价、图片、描述等详细…

Flutter iOS上架指南

本文探讨了使用Flutter开发的iOS应用能否上架,以及上架的具体流程。苹果提供了App Store作为正式上架渠道,同时也有TestFlight供开发者进行内测。合规并通过审核后,Flutter应用可以顺利上架。但上架过程可能存在一些挑战,因此可能…

5.3.1 配置交换机 SSH 管理和端口安全

5.3.1 实验1:配置交换机基本安全和 SSH管理 1、实验目的 通过本实验可以掌握: 交换机基本安全配置。SSH 的工作原理和 SSH服务端和客户端的配置。 2、实验拓扑 交换机基本安全和 SSH管理实验拓扑如图所示。 交换机基本安全和 SSH管理实验拓扑 3、实验步骤 &a…

HTML - 请你说一下如何阻止a标签跳转

难度级别:初级及以上 提问概率:55% a标签的默认语义化功能就是超链接,HTML给它的定位就是与外部页面进行交流,不过也可以通过锚点功能,定位到本页面的固定id区域去。但在开发场景中,又避免不了禁用a标签的需求,那么都有哪些方式可以禁用…

大话设计模式之适配器模式

适配器模式是一种结构型设计模式,它允许将一个类的接口转换成客户端所期望的另一个接口。这种模式通常用于使原本由于接口不兼容而不能一起工作的类能够协同工作。 适配器模式涉及以下几个关键角色: 1. 目标接口(Target)&#x…

5.3.2 实验2:配置交换机端口安全

1、实验目的 通过本实验可以掌握: 交换机管理地址配置及接口配置。查看交换机的MAC地址表。配置静态端口安全、动态端口安全和粘滞端口安全的方法。 2、实验拓扑 配置交换机端口安全的实验拓扑如图所示。 配置交换机端口安全的实验拓扑 3、实验步骤 &#xff…