论文解读|进一步融合:体积融合中6D姿态估计的多对象推理

news2024/11/17 1:49:17

原创 | 文 BFT机器人 

图片

01

背景

机器人等智能设备需要从它们的车载视觉系统中获得高效的基于物体的场景表示,以解释接触、物理和遮挡。已识别的精确对象模型将与未识别结构的非参数重建一起发挥重要作用。

本文提出了一个系统用于估计实时的接触和遮挡的精确姿态。从单个RGBD视图中提出三维对象姿态建议,在摄像机移动时从多个视图中积累姿态估计和非参数占用信息,并执行联合优化,以估计接触中的多个对象的一致的、不相交的姿态。

本文在两个对象数据集上通过实验验证了该方法的准确性和鲁棒性:YCB-Video和具有挑战性的杂乱的YCB-Video。

其具有周围空间感知的姿态预测,预测网络接收占用网格作为对象的不可穿透空间;多对象姿态的联合优化,对多对象的场景配置进行评估和更新;将融合和6D姿态作为实时系统,利用目标级体积图进行增量和精确的姿态估计。

机器设备在执行复杂的任务的时候,需要从相机中捕捉信息,从而对物体之间的接触、物理和遮挡进行推理,实现它们在混乱的环境中进行精确操作。一些短期任务通过端到端连接感知和动作的端到端学习模型来完成,但扩展和多阶段的任务可以在以后3D场景表示展现出巨大的潜力。

图片

图1 显示的是我们在一个实时的机器人抓取应用程序中演示了该系统

图片

图2 6D姿态估计系统

02

相关工作及文本思想

本文展开工作与这些RGB-D和基于学习的深度神经网络方法最密切相关。与之前工作中基于点云和以目标对象为主的方法相比,使用更结构化的体积表示和目标对象周围的几何信息来处理几何图形。

(1)对象级的体积融合阶段。

它将对象检测产生的对象实例掩模与深度测量和相机跟踪组件结合起来,以生成体积地图。物体级体积融合建立体积图是我们的姿态估计系统的第一阶段,它允许系统逐渐增加对场景的知识,直到有了对场景中物体姿态的理解。

对于这个目标级的体积融合阶段,本文构建了一个管道,结合了RGB-D相机跟踪、目标检测和被检测对象的体积映射。为了跟踪已经初始化的对象,使用当前帧中检测到的掩模的交叉过并集,之后渲染掩模当前重建。对于已经初始化的对象,我们将新的深度测量值融合到该对象的体积图中。

(2)体积姿态预测阶段。

它利用来自体积图的周围信息和RGB-D掩模来为每个对象产生一个初始的姿态预测。系统从体积图中检索周围的信息,以将目标物体周围区域的空间感知整合到姿态预测中。周围信息的边界框应该覆盖目标对象的整个区域,根据目标对象的大小而改变。由于使用固定的体素维数来进行网络预测,所以需将每个对象从对象模型大小计算出来,使用不同的体素大小。

为了结合二维和三维特征进行姿态预测,从三维特征网格中提取与二维特征对应的点和三插值。这些三维和二维特征被连接为点向特征向量来进行姿态预测,获取预测姿态和置信度。

图片

图3一个典型的例子对象分析

由于对象的可见性降低(例如,黄色框),姿态预测具有对象之间的交叉。ICC通过使用来自附近对象的约束和自由空间重建,将对象姿态细化为比ICP更好的配置。从交叉物体姿态细化的角度出发理解,本文比较提出的迭代碰撞检查(ICC)与迭代最近点(ICP)

(3)基于碰撞的姿态细化阶段。

通过使用物体CAD模型和已占据空间之间的可微碰撞检查,通过梯度下降联合优化多个物体的姿态。在联合优化中,引入了可微碰撞检查,包括对象CAD模型的占用体素化和占用网格之间的交叉损失。由于两者都是可微的,于是使用GPU上的优化批处理操作来优化对象姿态。

(4)CAD对齐阶段。

它用一个包含紧凑和丰富的信息的CAD模型替换每个对象的中间表示。在进行姿态估计和细化之后,一旦在不同视图中估计的姿态有足够的一致性,我们就会将对象CAD模型衍生到地图中。利用转换后的对象姿态使用姿态损失进行比较,使用姿态损失来训练姿态预测网络。

图片

图4 网络体系结构

利用目标对象的掩蔽RGB-D及其周围信息作为占用网格进行姿态预测

03

总结

本文使用YCB-Video数据集在之前的工作中被广泛用于评估6D姿态估计,但由于所有的场景都是桌面的,该数据集在对象方向和遮挡的多样性方面受到限制。

MoreFusion系统在YCB-Video和ClutteredYCB-Video两个物体数据集上进行了实验验证,并与其他方法进行了对比。

实验结果表明,MoreFusion系统在物体姿态估计方面具有更高的准确性和鲁棒性,特别是在存在遮挡和复杂背景的情况下。

此外,MoreFusion系统还可以在实时机器人应用程序中实现高效的物体检测和姿态估计,从而实现了机器人在复杂环境中精确有序地拆卸物体堆的能力。

因此,MoreFusion系统的主要优势是:具有周围空间感知的姿态预测、多物体姿态的联合优化和融合、6D姿态的完全集成以及在复杂环境中实现高效的物体检测和姿态估计。

作者 | George

排版 | 居居手

更多精彩内容请关注公众号:BFT机器人
(公众号后台回复“优惠活动”查看BFT机器人年终钜惠福利内容)

本文为原创文章,版权归BFT机器人所有,如需转载请与我们联系。若您对该文章内容有任何疑问,请与我们联系,将及时回应。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/814598.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

手写openFeign

目录 背景步骤应用级别:1、建立被调用方2、建立调用方引入依赖 3、实现效果 原理级别:调动方代码(注意impl在启动的时候里边是空的)引入jar包的代码(写好以后推到nexus上,再拉到上述调用方服务中&#xff0…

收集用户隐私行为规范与修改指引

为更好地保护用户隐私信息,优化用户体验,平台对小程序内的收集用户隐私行为进行规范,开发者可自查所涉及的违规内容,并参照修改指引进行相应整改。 常见违规内容 一、隐私政策协议默示同意 小程序在收集用户数据前,…

【高级程序设计语言C++】二叉搜索树

1. 二叉搜索树的概念2. 二叉搜索树的功能2.1. 二叉搜索树的简单模型2.2. 二叉搜索树的查找2.3. 二叉搜索树的插入2.4. 二叉搜索树的删除 3. 二叉搜索树的性能分析 1. 二叉搜索树的概念 二叉搜索树(Binary Search Tree,简称BST)是一种常见的二…

【C/C++】类之间的纵向关系——继承的概念

创作不易&#xff0c;本篇文章如果帮助到了你&#xff0c;还请点赞 关注支持一下♡>&#x16966;<)!! 主页专栏有更多知识&#xff0c;如有疑问欢迎大家指正讨论&#xff0c;共同进步&#xff01; &#x1f525;c系列专栏&#xff1a;C/C零基础到精通 &#x1f525; 给大…

C++——继承(2)详解

目录 一.子类和父类对象的赋值转换 子类对象赋值父类对象的另外两种方式&#xff1a; 总结&#xff1a; 二.父类与子类的作用域 1. 在继承体系中基类和派生类都有独立的作用域。 例&#xff1a; 2.作用域练习 练习1&#xff1a; 解决方法: 一.子类和父类对象的赋值转换 …

深入理解Java类加载机制中的双亲委派模型--根据源码探讨

前言&#xff1a; 今天和大家探讨一道Java中经典的面试题&#xff0c;这道面试题经常出现在各个公司的面试中&#xff0c;本篇文章主要讲解ava类加载机制中的双亲委派模型的知识。该专栏比较适合刚入坑Java的小白以及准备秋招的大佬阅读。 如果文章有什么需要改进的地方欢迎大…

Cesium态势标绘专题-三角旗标、矩形旗标、曲线旗标(标绘+编辑)

标绘专题介绍:态势标绘专题介绍_总要学点什么的博客-CSDN博客 入口文件:Cesium态势标绘专题-入口_总要学点什么的博客-CSDN博客 辅助文件:Cesium态势标绘专题-辅助文件_总要学点什么的博客-CSDN博客 本专题没有废话,只有代码,代码中涉及到的引入文件方法,从上面三个链…

前端JavaScript作用域详解

目录 前言 什么是作用域 作用域类型 全局作用域 局部作用域 块级作用域 ES6之前 ES6以后 作用域链 变量提升 基础概念 优先级问题 闭包 定义 特点 使用场景 封装私有变量 延长变量周期 模块化、命名空间 缓存 ES6的作用域 const、let 块级作用域 变量提…

tinymce4/5实现将word中内容(文字图片等)直接粘贴至编辑器中——利用插件tinymce-powerpaste-plugin

TinyMCE是一款易用、且功能强大的所见即所得的富文本编辑器。同类程序有&#xff1a;UEditor、Kindeditor、Simditor、CKEditor、wangEditor、Suneditor、froala等等。 TinyMCE的优势&#xff1a; 开源可商用&#xff0c;基于LGPL2.1 插件丰富&#xff0c;自带插件基本涵盖日常…

关于时序图

时序图 01 什么是时序图&#xff1f;02 时序图的组成元素2.1 对象2.2 生命线2.3 消息 03 如何绘制 01 什么是时序图&#xff1f; 时序图是UML交互图中的一类&#xff0c;又名序列图、顺序图。 用于描述对象之间的传递消息的时间顺序&#xff08;包括发送消息、接收消息、处理…

一个女程序员的成长之路

2013年大学毕业了&#xff0c;带着迷茫与好玩&#xff0c;我还年轻的心态&#xff0c;开始在郑州寻觅工作机会&#xff0c;最后很荣幸的在一家小公司入职了&#xff0c;工作的内容是给种植大棚的用户打电话&#xff0c;推销农药。每天就是在网上各种农业平台上面找号码&#xf…

ASIC-WORLD Verilog(11)过程时序控制

写在前面 在自己准备写一些简单的verilog教程之前&#xff0c;参考了许多资料----Asic-World网站的这套verilog教程即是其一。这套教程写得极好&#xff0c;奈何没有中文&#xff0c;在下只好斗胆翻译过来&#xff08;加了自己的理解&#xff09;分享给大家。 这是网站原文&…

【vue】vue中Mixins的用法(jeecg-boot为例):

文章目录 一、jeecg-boot本身只有JeecgListMixin.js二、使用Mixin:三、mixins详解&#xff1a;【1】由于每个项目的接口和参数不同>这里引进js进行处理&#xff0c;不在Mixin里面处理了&#xff08;Mixin只做公共数据处理&#xff09;【2】公共的页面字典【3】解决方法里面不…

2009年上半年 软件设计师 上午试卷3

●下图属于UML 中的&#xff08;46),其中&#xff0c;AccountManagement 需要&#xff08;47)。 (46)A.组件图 B.部署图 C.类图 D.对象图 (47)A.实现 IdentityVerifier 接口并被 CreditCardServices 调用 B.调用 CreditCardServices 实现的 Identity Verifier 接口 C.实现 I…

设计模式大白话——装饰者模式

装饰者模式 文章目录 装饰者模式一、概述二、应用场景三、代码示例四、小结 一、概述 ​ 装饰者模式&#xff0c;此模式最核心之处在于装饰二字&#xff0c;之所以需要装饰&#xff0c;是因为基础的功能无法满足需求&#xff0c;并且装饰是临时的&#xff0c;并不是永久的&…

基于Java+spring+springMvc+mybatis+jsp学生选课管理系统

基于JavaspringspringMvcmybatisjsp学生选课管理系统 一、系统介绍二、功能展示1.课程列表(学生)2.已选课程(学生)3.已修课程(学生)4.我的课程&#xff08;老师&#xff09;5.课程打分&#xff08;老师&#xff09;6.课程管理、学生管理、教师管理&#xff08;系统管理员&#…

python字典:怎么取出key对应的值

目录 python中的字典是什么 怎么判断key是否在字典中 怎么取出key对应的值 总结 python中的字典是什么 在Python中&#xff0c;字典&#xff08;Dictionary&#xff09;是一种无序且可变的数据类型&#xff0c;用于存储键-值&#xff08;Key-Value&#xff09;对。字典通过…

电脑卡顿反应慢怎么处理?提升反应速度的方法

电脑卡顿反应慢是很常见的问题&#xff0c;然而&#xff0c;我们可以采取一些方法来处理这个问题&#xff0c;帮助大家提升电脑反应速度。​ 一、提升电脑反应速度的方法 当电脑运行顺畅时&#xff0c;我们的工作体验也会更加愉悦。然而&#xff0c;如果电脑出现卡顿反应慢的…

【项目设计】MySQL 连接池的设计

目录 &#x1f449;关键技术点&#x1f448;&#x1f449;项目背景&#x1f448;&#x1f449;连接池功能点介绍&#x1f448;&#x1f449;MySQL Server 参数介绍&#x1f448;&#x1f449;功能实现设计&#x1f448;&#x1f449;开发平台选型&#x1f448;&#x1f449;MyS…

【雕爷学编程】MicroPython动手做(24)——掌控板之拓展掌控宝

知识点&#xff1a;什么是掌控板&#xff1f; 掌控板是一块普及STEAM创客教育、人工智能教育、机器人编程教育的开源智能硬件。它集成ESP-32高性能双核芯片&#xff0c;支持WiFi和蓝牙双模通信&#xff0c;可作为物联网节点&#xff0c;实现物联网应用。同时掌控板上集成了OLED…