NOIR脑机接口机器人——让脑机接口通过少样本学习实现做家务的能力

news2024/11/19 23:21:12

一、概述

大脑与机器人接口(BRI)是人类艺术、科学和工程的集大成之作,其影响已经贯穿于无数科幻作品和创意艺术之中,如《黑客帝国》和《西部世界》等。然而,要真正实现BRI并创造出能够与人类完美协同运作的机器人系统,却是一项非常艰巨的任务,需要进行突破性的科学研究。
在这个系统中,机器与人类通信的能力是至关重要的一环。在人机协作和机器人学习的过程中,人类传达意图的方式多种多样,包括动作、按按钮、注视、面部表情、语言等等。然而,通过神经信号直接与机器人通信,则是最令人激动却也最具挑战性的前景。

通过这一接口,人们能够更直接地将自己的思想和意愿传达给机器人,为机器人赋予更为智能化和人性化的特质。这种通信方式的实现不仅需要对神经科学的深入理解,还需要先进的工程技术来解读和应用这些神经信号。在这一充满未知的领域,科学家和工程师们正共同努力,推动着人机交互技术的飞速发展。BRI的成功将为人类与机器人之间的互动带来翻天覆地的变革,成为科技发展史上的一座新的里程碑。

最近,斯坦福大学的吴佳俊和李飞飞团队提出了NOIR系统,用户通过非侵入式脑电图装置即可控制机器人执行日常任务。NOIR系统能够将你的脑电图信号解码为机器人的技能库。它目前已经能够完成一系列任务,包括烹饪寿喜烧、熨烫衣物、磨碎奶酪、玩井字游戏,甚至抚摸机器狗等。这个模块化的系统具备强大的学习能力,可以应对日常生活中复杂多变的任务。

NOIR,这是一个通用的智能脑-机器人界面系统,使人类能够通过脑信号命令机器人执行日常活动。通过这个界面,人类使用脑电图(EEG)向机器人传达他们感兴趣的对象和行动意图。NOIR系统在包括烹饪、清理、个人护理和娱乐在内的20项具有挑战性的日常家务活动中取得了成功。系统的有效性得到了机器人学习算法的协同集成的改善,使NOIR能够适应个体用户并预测其意图。NOIR改善了人类与机器人互动的方式,用直接的神经通信取代了传统的互动渠道。

脑机机器人实现做家务的能力

论文地址:https://openreview.net/pdf?id=eyykI3UIHa
项目网站:https://noir-corl.github.io/

二、NOIR 系统

NOIR有两个主要组成部分,一个是模块化管道,用于解码来自人脑信号的目标。这个管道的设计使其能够有效地处理并解释由脑电图(EEG)等脑信号源产生的信息。
另一个主要组成部分是机器人系统,它包括一个原始技能库。这个技能库赋予机器人执行各种任务的基本能力,例如烹饪、清理、个人护理等。这使得机器人能够在执行任务时展现出一定的智能和独立性。

一个关键的特征是机器人系统的学习能力,它具有预测人类预期目标的能力。通过对人类行为和偏好的学习,机器人能够更好地理解用户的意图,减少人类解码所需的工作量。这种学习和适应性使得NOIR系统能够更好地与个体用户互动,提高系统的实用性和用户体验。整合了这两个组成部分,NOIR展现了在神经信号操作的智能机器人领域的前沿技术和创新。
在这里插入图片描述

1. 基于脑电信号的人类意图解码

NOIR使用模块化管道来从脑电图(EEG)信号中解码人类预期目标:

(a) 操作哪个对象: 通过采用光刺激诱发电位(SSVEP)信号,使用典型相关分析(CCA)分类器来解码应操作的对象。

(b) 如何与对象互动: 通过运动意向(MI)信号,采用共享子空间(CSP)和二次判别分析(QDA)算法,解码与对象互动的方式。

© 在何处互动: 同样是通过运动意向(MI)信号,解码在何处与对象互动。

为了确认或拒绝解码结果,NOIR还使用了一个安全机制,该机制通过捕捉颌部咬紧引起的肌肉张力来执行。这种安全机制有助于验证从脑电信号中解码的结果,以确保对机器人的指令准确性和安全性。这种方法的整合使得NOIR系统能够更加全面地理解和响应用户的意图,提高了系统的可靠性和实用性。
在这里插入图片描述

2.具有参数化原始技能的机器人

人类意图可以映射到14个参数化的机器人技能,例如Pick(x, y, z)、Place(x, y, z)和Push(x, y, z, d)。人类可以发现这些技能的新颖用途,并将它们组合起来以完成复杂的任务。

  • Pick(x, y, z): 指示机器人在坐标(x, y, z)处拾取物体。
    在这里插入图片描述

  • Place(x, y, z): 指导机器人将物体放置到指定坐标(x, y, z)。
    在这里插入图片描述

  • Push(x, y, z, d): 引导机器人将物体从当前位置推到新位置,其中距离参数(d)决定推动的范围。
    在这里插入图片描述

这种参数化的技能集使得机器人能够更灵活地响应人类的意图,并通过结合不同技能来解决具有挑战性的任务。这种方法允许机器人适应不同的情境,因为通过调整参数,它们可以在不同的位置、方向和距离上执行相似的任务。

3. 使用机器人学习实现高效的 BRI

解码人类意图耗时且成本高昂。机器人以少量示例学习人类对象、技能和参数选择,因此当它们在类似环境中执行相同任务时,可减少人类的工作和时间。
NOIR 系统检索式少样本对象和技能选择模型如下所示。它为观察结果学习了潜在表示。对于新的观察结果,它在记忆中寻找最相关的经验,并选择相应的技能和对象。
在这里插入图片描述
单样本技能参数学习算法如图所示。它在训练图像中给定一个参考点的情况下,在测试图像中找到一个语义对应的点。特征可视化展示了 DINOv2 使用的 768 个令牌中的其中 3 个。
在这里插入图片描述
在任务执行期间,NOIR 系统记录了由图像和人类选择的“物品 - 技能”对构成的数据点。这些图像首先经过预训练的 R3M 模型编码,以提取对机器人操控任务有用的特征。接着,这些特征通过一些可训练的全连接层,使用带有三元组损失的对比学习进行训练,这样可以鼓励具有相同“物品 - 技能”标签的图像在隐藏空间中靠近彼此。

训练得到的图像嵌入和“物品 - 技能”标签会被存储到内存中。在测试期间,模型会检索隐藏空间中最近的数据点,并向人类建议与该数据点关联的“物品 - 技能”对。

单样本技能参数学习通常需要人类大量参与,因为它需要精确的运动意象(MI)来进行光标操作。为了减少人类的工作量,团队提出了一种学习算法,能够根据给定的“物品 - 技能”对来预测参数。假设用户已经成功定位了拿起杯子把手的精确关键点,那么未来是否还需要再次指定这个参数呢?最近的基础模型(例如 DINOv2)取得了很大进展,已经可以找到相应的语义关键点,从而无需再次指定参数。

相较于之前的工作,这里提出的新算法是单样本的,并且预测的是具体的 2D 点,而不是语义片段。如图 4 所示,给定一张训练图像(360 × 240)和参数选择 (x, y),模型可以预测出不同测试图像中对应的语义点。团队具体使用的是预训练的 DINOv2 模型来提取语义特征。

4. 实验结果

使用NOIR系统,3名人类参与者(2男1女)完成了20个长期任务(4-15项技能),这些任务是日常活动。其中16项活动(No.2 - No.17)是使用Franka进行的桌面操作任务,另外4项(No.18 - No.21)是使用Tiago进行的移动操作任务。这些任务包括8项餐饮准备任务,6项清洁任务,3项个人护理任务和3项娱乐任务。
在这里插入图片描述
实验视频(加快了8倍):

脑机接口机器人实现结果

5. 量化结果

平均而言,每项任务需要 1.8 次尝试才能成功,任务完成时间为 20.3 分钟。任务视角是执行的基本技能的平均数量。# 尝试表示直到第一次成功所需的平均尝试次数(1 表示第一次尝试成功)。时间表示成功试验中的任务完成时间。人类时间表示人类用户总共花费的时间百分比,这包括决策时间和解码时间。
在这里插入图片描述
在实验的不同阶段的解码准确率。解码时间和准确性,就像几乎所有的BRI(脑机接口)研究一样,是关键挑战。
在这里插入图片描述
通过机器人学习算法,对象和技能选择学习可以将解码时间减少60%,参数学习可以减少光标移动距离41%。
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1210377.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

对一个Series序列执行多种聚合操作Series.aggregate()

【小白从小学Python、C、Java】 【计算机等考500强证书考研】 【Python-数据分析】 对序列同时做多种聚合计算 聚合计算:求最大、均值等 Series.aggregate() [太阳]选择题 关于以下代码的说法中正确的是? import pandas as pd a pd.Series([1,2,3]) print("【…

CNCC 2023收官,Milvus Cloud与行业大咖共话向量数据库系统

近期,CNCC 2023 在沈阳圆满结束,紧凑、前沿的 129 场技术论坛让人印象深刻。据悉,这 129 场技术论坛涵盖人工智能、安全、计算+、软件工程、教育、网络、芯片、云计算等 30 余个方向。Zilliz 受邀参与【智能时代的大数据系统】技术论坛。 智能时代的到来,无疑给社会经济和日…

.pcd文件格式

更详细的格式介绍可以查看我的这篇博客 『Open3D』安装与点云格式通识_open3d安装_NNNNNathan的博客-CSDN博客文章浏览阅读1.9k次。介绍了open3d的安装和当前适用与存储点云信息的文件格式,并详细介绍了pcd与ply两种格式。_open3d安装https://blog.csdn.net/qq_413…

Spring中的BeanFactory和ApplicationContext的区别

我用一个例子去测试BeanFactory和ApplicationContext的区别 首先建立一个bean public class User { //声明无参构造,打印一句话,监测对象创建时机public User(){System.out.println("User对象初始化");} } 然后再建立测试类 ublic class User…

Apache Airflow (七) :DAG调度周期设置

🏡 个人主页:IT贫道_大数据OLAP体系技术栈,Apache Doris,Clickhouse 技术-CSDN博客 🚩 私聊博主:加入大数据技术讨论群聊,获取更多大数据资料。 🔔 博主个人B栈地址:豹哥教你大数据的个人空间-豹…

轻松找回您的珍贵回忆的最好的 6 种照片数据恢复软件!

照片是珍惜过去珍贵时刻的唯一方式。它们让记忆永存,帮助我们重温生命中最美好的时刻。但是,当这些时刻丢失时会发生什么?您是否曾经因系统崩溃而意外删除或丢失照片?丢失照片可能令人心碎,但仍有希望,因为…

【计算思维】少儿编程蓝桥杯青少组计算思维题考试真题及解析

少儿编程 蓝桥杯青少组计算思维题考试真题及解析 单选题 1.多多观察一个立体图形,从不同的角度看到的形状如下图所示: 这个立体图形可能是 A. B. C. D. 2.将下图旋转后,可以得到的图片是 A、 B、 C、 D、 3.小鱼按照下面的规律排列&a…

C语言--指针与数组--遍历数组的n种方式【详细】

一.一维数组名的含义 arr一般表示数组的其实地址(除了两种例外) 1.在定义数组的同一个函数中(不是形参),求sizeof(arr),求整个数组的字节数 2.在定义数组的同一个函数中(不是形参),&arr1,加整个数组的大小 (经常考试) 3.除上面以外,arr都表示数组的…

Leetcode刷题详解——太平洋大西洋水流问题

1. 题目链接:417. 太平洋大西洋水流问题 2. 题目描述: 有一个 m n 的矩形岛屿,与 太平洋 和 大西洋 相邻。 “太平洋” 处于大陆的左边界和上边界,而 “大西洋” 处于大陆的右边界和下边界。 这个岛被分割成一个由若干方形单元格…

exsi的安装和配置

直接虚拟真实机 vcent server 管理大量的exsi SXI原生架构模式的虚拟化技术,是不需要宿主操作系统的,它自己本身就是操作系统。因此,装ESXI的时候就等同于装操作系统,直接拿iso映像(光盘)装ESXI就可以了。 VMware vCente…

Vscode编辑器保存时一直提示正在保存“index.vue”: 正在从“‘Vetur‘, ‘ESLint‘”获取代码操作

问题描述: Vscode在使用了Vetur, ESLint两个扩展配置了vue文件语法检查,保存时自动fix,经常会出现卡死,通知内容如下: 正在保存“index.vue”: 正在从“Vetur, ESLint”获取代码操作; 解决办法&#xff1a…

μC/OS-II---互斥信号量管理1(os_mutex.c)

目录 背景:优先级反转问题互斥信号量管理互斥信号量创建互斥信号量删除互斥信号量获取/等待 背景:优先级反转问题 在高优先级任务等待低优先级任务释放资源时,第三个中等优先级任务抢占了低优先级任务。阻塞时间是无法预测的,可能…

基于springboot实现学生选课平台管理系统项目【项目源码】计算机毕业设计

基于springboot实现学生选课平台管理系统演示 系统开发平台 在该地方废物回收机构管理系统中,Eclipse能给用户提供更多的方便,其特点一是方便学习,方便快捷;二是有非常大的信息储存量,主要功能是用在对数据库中查询和…

μC/OS-II---互斥信号量管理2(os_mutex.c)

目录 背景:优先级反转问题互斥信号量管理互斥信号量发出(释放)互斥信号量获取/无等待互斥信号量状态查询 背景:优先级反转问题 在高优先级任务等待低优先级任务释放资源时,第三个中等优先级任务抢占了低优先级任务。阻…

【JY】ANSYS Workbench在减隔震应用分析中的单元积分技术笔记

写在前文 尽管减隔震技术与有限元结合取得了众多成果,但仍面临诸多挑战,如材料非线性、模型不确定性等等。减隔震设计除了常规的宏观结构设计采用SAP2000、Etabs、Midas、SSG、Paco-SAP 或 YJK\PKPM等。 【JY】各类有限元软件计算功能赏析与探讨 我们需要…

解析数据洁净之道:BI中数据清理对见解的深远影响

本文由葡萄城技术团队发布。转载请注明出处:葡萄城官网,葡萄城为开发者提供专业的开发工具、解决方案和服务,赋能开发者。 前言 随着数字化和信息化进程的不断发展,数据已经成为企业的一项不可或缺的重要资源。然而,这…

Linux常用命令——bzgrep命令

在线Linux命令查询工具 bzgrep 使用正则表达式搜索.bz2压缩包中文件 补充说明 bzgrep命令使用正则表达式搜索“.bz2”压缩包中文件,将匹配的行显示到标注输出。 语法 bzgrep(参数)参数 搜索模式:指定要搜索的模式;.bz2文件&#xff1a…

Linux系统简介与开源精神

🎥 屿小夏 : 个人主页 🔥个人专栏 : Linux系统理论 🌄 莫道桑榆晚,为霞尚满天! 文章目录 📑前言🌤️Linux系统背景☁️UNIX发展史☁️Linux发展史☁️Linux系统企业应用现…

基于springboot实现校园医疗保险管理系统【项目源码】

基于springboot实现校园医疗保险管理系统演示 系统开发平台 在线校园医疗保险系统中,Eclipse能给用户提供更多的方便,其特点一是方便学习,方便快捷;二是有非常大的信息储存量,主要功能是用在对数据库中查询和编程。其…

2.6 Windows驱动开发:使用IO与DPC定时器

本章将继续探索驱动开发中的基础部分,定时器在内核中同样很常用,在内核中定时器可以使用两种,即IO定时器,以及DPC定时器,一般来说IO定时器是DDK中提供的一种,该定时器可以为间隔为N秒做定时,但如…