论文解读 | 超越人类智慧!类脑多模态混合神经网络助力机器人精准定位

news2025/1/12 4:44:06

原创 | 文 BFT机器人

01

研究内容

这篇论文的研究内容是基于大脑启发的多模态混合神经网络,用于机器人地点识别。研究人员设计了一个名为NeuroGPR的系统,该系统可以模拟大脑的多模态感知机制,从传统和神经形态传感器中编码和整合多模态线索,以实现机器人的地点识别。为了实现这一目标,研究人员使用了多尺度液态状态机等多种神经网络模型,以异步融合多模态信息。研究结果表明,NeuroGPR在机器人地点识别方面表现出更好的性能和鲁棒性,具有广泛的应用前景。

02

论文原理

a.大脑启发的多模态感知机制

研究人员从大脑的多模态感知机制中获取灵,设计了一个基于大脑启发的多模态混合神经网络模型,用于机器人地点识别。该模型可以模拟大脑的多模态感知机制,从传统和神经形态传感器中编码和整合多模态线索,以实现机器人的地点识别。

图1所示。人类和机器人的位置识别机制。

A)人类可以根据具有时空连续性的多态感觉线索来识别一个地方。位置由外部感觉织响和内部连接的时空细的给码。多通消的感觉线索可以共同激活这些细胞。联合放电模式可以唯一地编码和回忆一个特定的地方。

(B) 该机器人可以识别一个地方的大脑启发的地方识别系统,simiarlv的机器人可以使用多模态传感器获得环境的感官线索。一个部署在一个神经形态计算芯片上的mhnn模型被用来对这些感觉线索进行码,该模型可以用多时空尺度的融合方法对位置进行可第的识别。

b.多尺度液态状态机

研究人员引入了多尺度液态状态机等多种神经网络模型,以异步融合多模态信息。这些模型可以在不同的时间尺度和空间尺度上处理信息,从而提高了信息处理的效率和准确性。

c.混合神经芯片

研究人员在Tianjic等混合神经芯片上实现了NeuroGPR系统,并将其集成到四足机器人中进行测试。混合神经芯片具有并行计算和低功耗等优点,适用于移动机器人等资源受限的场景。

图2.神经地质雷达系统的体系结构。AJMHNN模型由一个CNN、一个SNN和三个戛纳组成。从感官线索表示中提取多模态特征,并利用MLSM进行多时空尺度融合。

(B)神经地质雷达系统的关键组成部分。该系统由多模态传感器、神经形态计算芯片天极和四足机器人组成。

(C)神经地质雷达系统的管道,主机计算平台专门用于传感器数据采集、数据预处理、机器人控制和数据通信。MHNN被映射并部署在Tianjic上,Tianiic根据查询数据的输入来识别位置。

03

创新点

1. 设计了一个基于大脑启发的多模态混合神经网络模型。

该模型可以模拟大脑的多模态感知机制,从传统和神经形态传感器中编码和整合多模态线索,以实现机器人的地点识别。

2. 引入了多尺度液态状态机等多种神经网络模型,以异步融合多模态信息。

这些模型可以在不同的时间尺度和空间尺度上处理信息,从而提高了信息处理的效率和准确性。

3. 在Tianjic等混合神经芯片上实现了NeuroGPR系统,并将其集成到四足机器人中进行测试。

实验结果表明,NeuroGPR在机器人地点识别方面表现出更好的性能和鲁棒性,具有广泛的应用前景。

4. 通过比较NeuroGPR与传统和现有的基于生物启发的方法,证明了NeuroGPR的优越性。

此外,NeuroGPR还具有低延迟和低功耗等优点,适用于移动机器人等资源受限的场景。

04

实验过程

1.设计和实现NeuroGPR系统。

研究人员设计了一个基于大脑启发的多模态混合神经网络模型,用于机器人地点识别。他们还引入了多尺度液态状态机等多种神经网络模型,以异步融合多模态信息。最后,他们在Tianjic等混合神经芯片上实现了NeuroGPR系统,并将其集成到四足机器人中进行测试。

2. 进行地点识别实验。

研究人员在不同的环境中测试了NeuroGPR系统的地点识别能力,包括走廊、楼梯、森林等场景。他们使用传统和神经形态传感器获取多模态线索,并将其输入到NeuroGPR系统中进行处理和识别。实验结果表明,NeuroGPR在不同的环境中都表现出了较好的地点识别能力。

测试的查询线索的快照

图3所示,实验环境的快照。机器人实验在房间(A)、走廊(C)和森林(E)环境中的快照。房间(B)、走廊(D)和森林(F)环境中用于训练的参考线索

3. 比较NeuroGPR与传统和现有的基于生物启发的方法。

研究人员将NeuroGPR与传统的视觉SLAM方法和现有的基于生物启发的方法进行了比较,实验结果表明,NeuroGPR在地点识别方面表现出了更好的性能和鲁棒性。

4. 测试NeuroGPR在移动机器人上的应用。

研究人员将NeuroGPR集成到四足机器人中进行测试,实验结果表明,NeuroGPR在移动机器人上的应用具有低延迟和低功耗等优点,适用于资源受限的场景。

05

比较NeuroGPR与传统和现有的基于生物启发的方法

研究人员在不同的环境中测试了NeuroGPR和其他方法的地点识别准确性,实验结果表明,NeuroGPR在地点识别方面表现出了更好的性能和鲁棒性。

研究人员在Tianjic等混合神经芯片上测试了NeuroGPR和其他方法的计算效率,实验结果表明,NeuroGPR具有更低的延迟和功耗,适用于移动机器人等资源受限的场景。

研究人员测试了NeuroGPR和其他方法在不同的环境和条件下的鲁棒性,例如光照变化、天气变化、运动模糊等,实验结果表明,NeuroGPR具有更好的鲁棒性和适应性。

图4,对环境变化鲁棒性的实验结果。同模块对清华大学森林数据集A)、布里斯班事PR数集(B)和走廊数据集)识别精度的影响。在房间数据集D)、走廊数据集(E)和Brisbane-Event-PR数据集(F)上评估不同模型的识精度。的平均误差和SD的基础上,在五个实验中获得的结果。

06

进行计算性能测试的步骤

1.在Tianjic等混合神经芯片上测试NeuroGPR系统的计算性能。

研究人员使用Tianjic等混合神经芯片测试了NeuroGPR系统的计算性能,包括计算延迟和功耗等指标。他们还将NeuroGPR系统与其他常用的移动机器人处理器进行了比较,以评估其计算性能的优劣。

图5,计算效率和精度的实验结果。处理单个NN工作负载(A)和多NN工作负载(B)的延迟计算。(C)多神经络负荷试验下加工MHNN的功耗.D)神经地质雷在机器人上运行的准确性。基于不同数据集的位置识别精度(E)、查全率(F)和查全率曲线(G和H)。平均误差和SDS是根据五个实验的结果得出的。

2. 在其他常用的移动机器人处理器上测试NeuroGPR系统的计算性能。

研究人员在其他常用的移动机器人处理器上测试了NeuroGPR系统的计算性能,包括NVIDIA Xavier NX和AGX Orin等处理器。他们使用NVIDIA tegrastats等工具获取了这些处理器的计算延迟和功耗等指标,并将其与Tianjic等混合神经芯片进行了比较。

07

结论

1.NeuroGPR系统在不同的环境中都表现出了较好的地点识别能力,具有较高的准确性和鲁棒性。

2.与传统的视觉SLAM方法和现有的基于生物启发的方法相比,NeuroGPR在地点识别方面表现出了更好的性能和鲁棒性。

3.NeuroGPR在移动机器人上的应用具有低延迟和低功耗等优点,适用于资源受限的场景。

4.在计算性能测试中,NeuroGPR具有更低的延迟和功耗,适用于移动机器人等资源受限的场景。

08

社会意义

该研究成果对促进机器人技术发展、推动人工智能技术进步、以及促进人机交互技术的发展中都具有重要的意义,并且该系统还可以在各行各业中广泛运用,以下四个领域为例:

1. 机器人导航和环境感知。

NeuroGPR系统可以帮助机器人在未知环境中进行自主导航和地点识别,从而提高机器人的智能化水平和工作效率。

2. 智能制造和自动化控制。

NeuroGPR系统可以用于智能制造中的自动化控制和质量检测,从而提高生产效率和产品质量。

3. 智能家居和智能城市。

NeuroGPR系统可以用于智能家居、智能城市和智能交通等领域,以提高人们的生活质量和城市的可持续发展。

4. 医疗保健和辅助生活。

NeuroGPR系统可以用于医疗保健和辅助生活领域,例如帮助残障人士进行自主移动和生活,提高他们的生活质量。

由此可见,NeuroGPR系统具有广泛的应用前景,可以帮助解决许多行业的实际问题,提高生产效率和提升人们的生活质量。

更多精彩内容请关注公众号:BFT机器人


本文为原创文章,版权归BFT机器人所有,如需转载请与我们联系。若您对该文章内容有任何疑问,请与我们联系,将及时回应。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/649695.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

消息队列的基本概念

每种消息队列都有自己的一套消息模型,像队列(Queue)、主题(Topic)或是分区(Partition)这些名词概念,在每个消息队列模型中都会涉及一些,含义还不太一样。 为什么出现这种…

1.8C++流提取运算符重载

C流提取运算符重载 在 C中,流提取运算符(>>)是用于从流中提取数据的运算符。 C中的流提取运算符可以被重载,使得程序员可以自定义输入对象的方式,更方便地输入自定义的数据类型,也可以使得输入更加…

阿里云轻量应用服务器和云服务器ECS区别(终于懂了)

阿里云服务器ECS和轻量应用服务器有什么区别?云服务器ECS是明星级云服务器,轻量应用服务器可以理解为简化版的云服务器ECS,轻量适用于单机应用,云服务器ECS适用于集群类高可用高容灾应用,阿里云百科来详细说下阿里云轻…

dbGet 快速学习教程

dbGet是innovus/encounter工具自带的"database access command"命令中的一部分,它几乎可以用来获取设计相关的一切信息。 输入dbGet 按[Tab]键,能看到三个选项,分别是head / top /selected。这三个选项所代表的意义如下: head --…

Vue3对于一个前端来讲意味着什么?

最近很多技术网站,讨论的最多的无非就是Vue3了,大多数都是Composition API和基于Proxy的原理分析。但是今天想着跟大家聊聊,Vue3对于一个低代码平台的前端更深层次意味着什么? 首先,Vue是前端三大主流框架之一&#xf…

python,如何设置定时执行python代码-windows本地

最近写了一个python小程序,希望能每天定时执行,但是又不想用jenkins这样的工具,后来发现windows本地就可以设置,而且很好用,具体步骤如下: 首先,需确保本地python代码已编写好,环境…

c++创建对象常见的坑

c创建对象常见的坑 创建对象的时候不要在对象名后面加空的圆括号,编译器误认为是声明函数。(如果没有构造函数、构造函数没有参数、构造函数的参数都有默认参数)在构造函数名后面加括号和参数不是调用构造函数,是创建匿名对象。以…

【有奖调研】HarmonyOS新物种,鸿蒙流量新阵地——元服务邀你来答题!

“聊技术无话不谈,一起来吹吹元服务!畅聊你对元服务的想法,说不定,你就能撬动元服务的爆发增长!” 元服务(即原子化服务)是华为“轻量化”服务的新物种,可提供全新的服务和交互方式…

人工智能(pytorch)搭建模型12-pytorch搭建BiGRU模型,利用正态分布数据训练该模型

大家好,我是微学AI,今天给大家介绍一下人工智能(pytorch)搭建模型12-pytorch搭建BiGRU模型,利用正态分布数据训练该模型。本文将介绍一种基于PyTorch的BiGRU模型应用项目。我们将首先解释BiGRU模型的原理,然后使用PyTorch搭建模型…

uniApp -- 学习笔记(vue3+ts)

uniApp学习笔记目录 一.关于界面节点信息 6月15 一.关于界面节点信息 6月15 uniApp官网介绍 (一) 个人理解是官网返回一个 SelectorQuery 对象实例。 并且可以在这个实例上使用 select 等方法选择节点,并使用 boundingClientRect 等方法选择…

使用 Sharesheet分享Android 应用链接

使用 Sharesheet分享Android 应用链接 使用 Sharesheet 进行丰富的链接共享 Android App Links 允许您的应用程序打开网页链接,而不是使用网络浏览器。处理这些深层链接已在我们的《深层链接入门课程》中介绍过。除了能够打开深层链接外,您的应用程序还…

《Lua程序设计》--学习8

编译,执行和错误 编译 可以认为dofile函数就是这样: loadfile函数从文件中加载Lua代码段,但它不会运行代码,只是编译代码,然乎将编译后的代码段作为一个函数返回 函数loadfile更灵活。在发生错误的情况中&#xff0…

100种思维模型之排列组合思维模型-78

说到模型,一般人会觉得特别难,会觉得是学霸级别的人才能做出来的高科技。 然实际上并不是! 西方人常说Model,模型在西方人眼里是一个非常常见的词。 查理芒格,多元思维模型倡导者和践行者,他说任何能够帮助…

Elasticsearch:实用 BM25 - 第 1 部分:分片如何影响 Elasticsearch 中的相关性评分

作者:Shane Connelly 背景 在 Elasticsearch 5.0 中,我们切换到 Okapi BM25 作为我们的默认相似度算法,这是用于对与查询相关的结果进行评分的算法。 在本博客中,我不会过多地介绍 BM25 与替代措施,但如果你想了解 B…

3天没睡吐血整理,性能测试瓶颈问题+分析,一篇概全...

目录:导读 前言一、Python编程入门到精通二、接口自动化项目实战三、Web自动化项目实战四、App自动化项目实战五、一线大厂简历六、测试开发DevOps体系七、常用自动化测试工具八、JMeter性能测试九、总结(尾部小惊喜) 前言 如何定位性能瓶颈…

白鲸优化算法优化VMD参数,并提取特征向量,以西储大学数据为例,附MATLAB代码

大家看到这篇文章,肯定会有疑问,难道本篇文章和上一篇文章不是一个意思嘛,这是来凑数的嘛……其实不然,如果各位读者仔细看,就会发现本篇文章和上一篇文章大有不同,这篇文章也是我一直以来想在上一篇文章基…

TALL论文笔记

TALL论文笔记 0.论文来源1摘要2引言3模型结构3.1视觉编码器3.2句子编码器3.3模态融合3.4时间定位回归网络 4训练4.1损失函数4.2采集训练样本 5 评估5.1数据集5.2评价指标5.3实验结果 0.论文来源 2017 TALL 1摘要 问题描述:通过语言来对未修剪视频中动作的时间定位…

【JVM】日志分析工具--gcviewer的使用

文章目录 gcviewer是什么?gcviewer的使用最后 gcviewer是什么? GCViewer是一个小工具,可以可视化Sun / Oracle、IBM、HP和BEA Java虚拟机生成的详细GC输出。它是在GNU LGPL下发布的自由软件。—官网翻译 gcviewer的使用 文章使用的配置 工具…

Dubbo面试题

Dubbo 基础知识为什么要用 Dubbo?Dubbo 是什么?Dubbo 的使用场景有哪些?Dubbo 核心功能有哪些? 架构设计Dubbo 服务器注册与发现的流程?Dubbo 的整体架构设计有哪些分层?Dubbo Monitor 实现原理? 分布式框…

一键部署通义千问预体验丨阿里云云原生 5 月动态

云原生月度动态 云原生是企业数字创新的最短路径。 《阿里云云原生每月动态》,从趋势热点、产品新功能、服务客户、开源与开发者动态等方面,为企业提供数字化的路径与指南。 本栏目每月更新。 01 趋势热点 🥇 Apache RocketMQ 入选可信开…