ICRA 2024 基于transformer大模型实现机器人自主导航

news2024/11/18 3:27:39

在陌生环境中进行导航的机器人需要提供决策:面向任务的导航(到达设定好机器人目标点),以及 与任务无关的探索(在新颖的环境中寻找目标)。通常,这些角色由单独的模型处理,例如通过使用子类目标导航算法、路径规划或 单独的导航策略。本文中描述了如何训练一个统一的扩散策略模型将所有的任务鞣和起来,用于处理面向目标的导航和与目标无关的探索,后者提供搜索新环境的能力,而前者提供 一旦找到用户指定的目标,就能识别并终止。现象表明,这种统一模型在导航到图像视觉指定的目标时,策略会带来更好的整体性能 与使用生成式子目标导航算法的方法相比,陌生环境下,模型需要基于潜在变量训练。

通过使用基于数据训练的大规模基于 Transformer 的策略来实例化方法,以下来自多个机器人,带有扩散模型解码器,可灵活处理两者目标条件和目标无关导航。在陌生环境中显示有效的导航,并在图像显示出 5种规划的路径,并显示出性能的显着改善和更低的碰撞率,同时,使用的模型比最先进的方法要小。
在这里插入图片描述

NoMaD 架构:NoMaD 使用 ViNT 模型对观察值和目标图像的上下文向量进行编码,如果 执行目标导向导航,则使用上下文向量来约束扩散模型来生成分布动作。
NoMaD 室内:NoMaD 使用 ViNT 对用于调节扩散过程的上下文向量进行编码。这 意味着它可以通过采用拓扑结构来探索以前看不见的环境。展示了 NoMaD 探索以前看不见的办公环境,并实现目标。在 在这种环境中,NoMaD 展示了避开墙壁和障碍物的紧急能力,以及生成多种动作分布。
NoMaD 户外
除了室内环境的结构外,NoMaD还能够进行长期探索和 户外环境中的导航。展示了 NoMaD 探索以前看不见的户外环境, 并达到目标。在这种环境中,NoMaD 展示了与室内相同的功能 ,同时由于隐式导航而坚持人行道并避开道路,当然这是在训练 数据集中的首选项。

基线比较
将NoMaD与其他最先进的方法进行了比较,包括具有图像扩散的ViNT 子目标、自回归动作生成和 VIB。发现 NoMaD 以更少甚至没有动作避障。NoMaD 在障碍物不同的情况下,更能体现出多模态的能力 ,与其他方法相比,它能够避免碰撞并更有效到达目标。

NoMaD:导航和探索的目标掩蔽扩散策略 (general-navigation-models.github.io)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1867789.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

“北京到底有谁在啊”影视APP开发,解锁最简单的快乐

随着电视剧《玫瑰的故事》在腾讯视频APP热播,APP也增加了很多热度,一款丰富的影视APP,无论是热门大片、经典影视剧、还是最新综艺节目,能畅享无限精彩的影视内容! 开发影视APP,需要专业的技术服务商来解决…

DM达梦数据库转换、条件函数整理

💝💝💝首先,欢迎各位来到我的博客,很高兴能够在这里和您见面!希望您在这里不仅可以有所收获,同时也能感受到一份轻松欢乐的氛围,祝你生活愉快! 💝&#x1f49…

【分布式系列】分布式锁在 Redis 主从部署中的挑战

💝💝💝欢迎来到我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。 推荐:kwan 的首页,持续学…

ABAP ALV报表性能优化 经验总结

优化ALV报表,最主要就是优化取数逻辑和数据库查询。因为几乎在所有的程序中都会用到数据库查询,所以这篇文章的内容也不仅局限于SAP、ABAP程序,虽然ABAP有其特殊之处。 优化的时候我遵从以下几个原则: 1.把数据库连接视为一种极其…

Nginx常见的基本配置(全网最详细!!!)

🪁Nginx常用命令 🎨Nginx正向代理 🥏Nginx反向代理 🔮Nginx负载均衡 🎁Nginx基本配置详解 ## # 全局配置 ##user www-data; ## 配置 worker 进程的用户和组 worker_processes auto; ## 配置 worke…

最新版Git安装指南使用指南

首先,访问Git的官方网站https://git-scm.com下载适用于您操作系统的安装包。您也可以选择使用阿里云镜像来加速下载过程。 也可以用国内地址下载https://pan.quark.cn/s/0293d76e58bchttps://pan.quark.cn/s/0293d76e58bc安装过程 在这里插入图片描述 2、点击“…

前缀和算法系列|概念讲解|应用场景|大量例题讲解

大家好,我是LvZi,今天带来前缀和算法系列|概念讲解|应用场景|大量例题讲解 一.模版解析 1.一维前缀和 一维前缀和就是一个简单的dp问题 状态表示:dp[i]:以i位置为结尾的所有元素的和状态转移方程:dp[i] dp[i - 1] arr[i] 链接:一维前缀和(模版题) 代码: import java.ut…

短信群发70字计费标准及内容编辑规范详解

短信群发营销,作为一种简单高效的推广方式,备受企业和个人青睐。然而,在启动短信群发营销前,了解相关常识同样重要。 一、短信字数限制与计费标准 短信群发时,字数限制是一个关键因素。每个汉字、字母、数字、符号均计…

虚拟机字节码执行引擎之运行时栈帧结构

概述 执行引擎是Java虚拟机核心的组成部分之一。“虚拟机”是一个相对于“物理机”的概念,这两种机器都有代码执行能力,其区别是物理机的执行引擎是直接建立在处理器、缓存、指令集和操作系统层面上的,而虚拟机的执行引擎则是由软件自行实现的,因此可以不受物理条件制约地定…

艺术与科技的精湛融合:探讨AI绘画与AI动画的交汇点

前言 艺术与科技的精湛融合:探讨AI绘画与AI动画的交汇点 在当代社会中,艺术和科技的结合呈现出了从来灭有的创新和可能性。随着人工智能技术的不断发展,AI绘画与AI动画的融合愈发引人瞩目。这一融合不仅给艺术家们带来了更多创作的可能&…

【项目实训】数据库内容丰富

经团队讨论,对前端页面展示数据进行了增加,于是相应的修改数据库 经团队成员使用大模型对各公司面试经验中问题的总结优化,我们打算将大模型的回答存储到数据库中,以显示在前端页面 于是在数据库中存储大模型的回答:…

什么是代码签名证书?有什么作用?

代码签名证书是一种特殊的数字证书,主要用于软件发布领域,旨在确保软件代码的完整性和来源的真实性。它是由可信赖的证书颁发机构(CA)签发的,为软件开发者提供了一种方式来证明其身份,并保证软件在发布后未…

科技未来·无限可能“2024世亚智博会”

随着科技的飞速发展,人类社会正以前所未有的速度迈向一个全新的时代。科学技术作为第一生产力,不仅极大地推动了经济和社会的发展,更在不断地改变着我们的生活方式和思维方式。特别是在人工智能、物联网等前沿科技领域,其创新和应…

酷开系统丨开启家庭智能教育让学习成为一种乐趣

在数字化时代,孩子们接触的信息日益增多,而酷开系统洞察到了家长对孩子成长环境的关切。酷开系统,作为家庭娱乐与教育的融合平台,不仅注重提供丰富的教育资源,更致力于创造一个健康、有益的学习和娱乐环境。 在酷开系…

当电力市场碰上量化分析技术,如何构建高效电力交易解决方案?

在数字化浪潮的推动下,物联网技术正重塑着各领域,电力交易市场亦不例外。作为能源市场的关键一环,电力交易的效率和透明度对于保障能源系统的稳定运行和可持续发展具有重要意义。物联网技术的兴起为电力交易市场带来了精细化资源管理的新机遇…

KaiwuDB 事务中的 Raft 协议

01 Raft 概述 KaiwuDB 的事务是通过使用 Raft 协议来实现数据的一致性。Raft 协议是一种经典的分布式一致性算法,它的主要特征有: 选举唯一的 Leader 处理读写请求并创建新的 Raftlog,其它节点作为 Follower 接收 Leader 同步的 Raftlog&am…

支付交易——外卡收单流程

摘要 近几年以来,随着跨境贸易和跨境服务也都不断发展,外卡收单行业呈现出新的发展态势。随着外籍人士入华消费场景增多,越来越多的中国商户为了满足海外消费者的需求开始逐渐接受国际信用卡支付。据官方统计数据截止2023年11月,…

Adobe Animate有必要学习AS3脚本吗?

AdobeAnimate软件已经慢慢的替代Flash系列软件在动画中的地位了,也越来越多的出现在各专业课中。不过还是以动画制作方面的教学为主。 Animate软件从入门到提高系列课程​http://www.bilibili.com/cheese/play/ss1826 也有不少同学知道从Flash系列开始,…

vue3使用vant4的列表vant-list点击进入详情自动滚动到对应位置,踩坑日记(一天半的踩坑经历)

1.路由添加keepAlive <!-- Vue3缓存组件&#xff0c;写法和Vue2不一样--><router-view v-slot"{ Component }"><keep-alive><component :is"Component" v-if"$route.meta.keepAlive"/></keep-alive><component…

[JS]DOM事件

事件监听 让程序检测是否有事件产生, 一旦事件触发, 就调用函数做出响应 事件三要素: 事件源(谁的事件) 事件类型(如何触发) 事件处理程序(做什么) function fn() {} // 绑定事件 btn.addEventListener(click, fnction() { })// 绑定事件 btn.addEventListener(click, fn)//…