【佳佳怪文献分享】使用点云从半监督到全监督房间布局估计

news2025/1/22 14:47:16

标题:From Semi-supervised to Omni-supervised Room Layout Estimation Using Point Cloud

作者:Huan-ang Gao, Beiwen Tian, Pengfei Li, Xiaoxue Chen, Hao Zhao, Guyue Zhou , Yurong Chen and Hongbin Zha

来源:2023 IEEE International Conference on Robotics and Automation (ICRA 2023)

这是佳佳怪分享的第6篇文章

摘要

房间布局估计是一项存在已久的机器人视觉任务,对环境感知和运动规划都有好处。然而,由于标注困难,使用点云(PC)进行布局估计仍存在数据稀缺的问题。因此,我们基于模型指数移动平均的理念,解决了这一任务的半监督设置问题。但要将这一方案调整为基于 PC 的布局估计的最先进(SOTA)解决方案并非易事。为此,我们定义了一种四元组匹配策略,并根据为布局四元组量身定制的指标定义了几种一致性损失。此外,我们还提出了一种新的在线伪标签采集算法,该算法将四边形和 PC 之间的混合距离度量分布分解为两个部分。该技术无需手动选择阈值,可直观地鼓励四边形与可靠的布局点对齐。令人惊讶的是,这一框架也适用于完全监督设置,在 ScanNet 基准测试中取得了新的 SOTA。最后但并非最不重要的一点是,我们还将半监督设置推向了现实的全监督设置,在新注释的 ARKitScenes 测试集上展示了显著提升的性能。我们的代码、数据和模型都是公开的。

在这里插入图片描述
图 1. (a) 输入是三维点云,其颜色仅用于可视化。(b) 我们仅使用 ScanNet 训练集中 20% 的标注数据训练前 SOTA 方法 PQ-Transformer,并将其作为基线。© 我们在整个 ScanNet 训练集上采用我们的方法,只使用 20% 的标注数据,结果布局预测更加准确。
在这里插入图片描述
​图 2. 方法概述。在每次训练迭代中,我们从有标签数据集和无标签数据集中分别抽取样本,形成一个批次。首先对输入批次进行随机变换,然后将其输入学生模型,生成预测结果。与此同时,输入批次也被送入教师模型,然后经过变换得出预测结果。在采用的两种转换中,FPS 采样使用不同的种子,而旋转、翻转和缩放则完全相同。我们总共施加了三种损失:(1) 转化标签与学生模型预测之间的监督损失。(2) 一致性损失,即最小化学生预测与教师预测之间的差异。(3) 鼓励四边形与可靠布局点对齐的伪标签损失。学生参数根据三种损失之和通过梯度下降法更新,而教师参数则通过学生参数的指数移动平均(EMA)法更新。
在这里插入图片描述
图 3. 师生对齐图解。(a) 对于每一个教师预测的四边形,我们都会找到最近的学生预测的四边形。尽管教师的预测是有噪声的,但四边形度得分却能说明预测的准确性。预测的准确性。(b) 这三个图说明了两个四边形之间定义距离的三个组成部分。定义的两个四边形之间的距离。
在这里插入图片描述
图4。关于Gamma混合滤波的插图。我们在(b)中计算了所提出的点和四边形之间的混合度量,其中较暖的颜色表示较短的距离。然后,我们将度量的分布分解为两个分量,分别对应于属于四边形和不属于四边形的点。我们使用混合分布模型(如(c)所示)过滤掉冗余点,并以更高的精度重新估计四边形,供学生模型学习。
在这里插入图片描述
图 5. ScanNet 的定性结果。比例代表使用中的注释数据比例。
在这里插入图片描述
图 6. ARKitScenes 的定性结果。地面真实布局由crowd-sorcing注释。
在这里插入图片描述
表I 扫描网的布局估计F1-SCORES
在这里插入图片描述
表 II 场景布局估计 F1 分数
在这里插入图片描述
表III 数据转换策略的消融
在这里插入图片描述
表IV 四均值教师消融
在这里插入图片描述

表 V 伽马混合滤波的消融情况

结论

我们的研究迈出了仅使用点云进行全监督布局估计的第一步,这在机器人领域具有很好的应用前景。我们的训练框架结合了四均值教师和伽玛混合滤波,以更好地利用未标记的数据。实验结果证明了我们的方法在半监督、全监督和全监督环境中的有效性。尽管我们的方法有效,但局限性仍然存在。在不完整的场景中,我们的方法的预测是不令人满意的,在这些场景中,不足的点无法形成布局墙。未来,由于PQ Transformer[29]实现带来的准实时速度,我们将考虑可能的纠正措施,包括整合在线推理结果。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/887480.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Android系统-线程-消息处理机制

引言: Android应用消息处理机制是怎么样的呢? 跟Native,Linux底层都有些什么关系呢? 概念与理解: Android应用程序是通过消息来驱动的。 1)应用程序的每一个线程在启动的时候,都可以首先在内…

Swagger-ui在idea中的使用

1.添加依赖 <!--添加swagger2相关概念--><dependency><groupId>io.springfox</groupId><artifactId>springfox-swagger2</artifactId><version>2.9.2</version></dependency><!--添加swagger-ui相关功能--><de…

【贪心+堆】CF1701 D

Problem - 1701D - Codeforces 题意&#xff1a; 思路&#xff1a; 手推样例可知&#xff1a; 一开始想的是&#xff0c;把这些区间按右端点排序&#xff0c;然根据排序后的贪心 事实上不是这样的&#xff0c;而是要把有可能的区间扔进堆里&#xff1a; 感觉这种带堆的贪心&…

【TI-CCS笔记】工程编译配置 bin文件的编译和生成 各种架构的Post-build配置汇总

【TI-CCS笔记】工程编译配置 bin文件的编译和生成 各种架构的Post-build配置汇总 TI编译器分类 在CCS按照目录下 有个名为${CG_TOOL_ROOT}的目录 其下就是当前工程的编译器 存放目录为&#xff1a; C:\ti\ccs1240\ccs\tools\compiler按类型分为五种&#xff1a; ti-cgt-arm…

J‘meter 连接 MySQL 数据库脚本

1、创建线程组 2、创建 JDBC Connection Configuration 3、创建 JDBC Request 4、最终创建的目录 5、重点来了 5.1 在百度中下载个 MySQL-connector-Java-8.0.28.jar&#xff0c;放在 jmeter 的 bin 目录下 5.2 在测试计划中&#xff0c;将 jar 包添加到脚本中 5.3 输入参…

如何查看mysql中各个表的数据大小

1.SHOW VARIABLES LIKE datadir; 这会显示 MySQL 数据目录的路径。在这个路径下&#xff0c;你可以找到每个数据库的文件夹&#xff0c;每个数据库文件夹中会包含各个表的 .ibd 文件。 2.进入对应的目录 3.进入对应的db&#xff0c;例如我自己的db为test 4.如果我们想以M为单…

在Gazebo中添加悬浮模型后,利用键盘控制其移动方法

前段时间写了文章&#xff0c;通过修改sdf、urdf模型的方法&#xff0c;在Gazebo中添加悬浮模型方法 / Gazebo中模型如何不因重力下落&#xff1a;在Gazebo中添加悬浮模型方法 / Gazebo中模型如何不因重力下落&#xff1a;修改sdf、urdf模型_sagima_sdu的博客-CSDN博客 今天讲…

2401. 最长优雅子数组;1111. 有效括号的嵌套深度;2134. 最少交换次数来组合所有的 1 II

2401. 最长优雅子数组 核心思想&#xff1a;滑动窗口。如何知道当前值与以前的值是否and为0很重要&#xff0c;这是这道题目的关键&#xff0c;and操作会把1变成0&#xff0c;但是不会把0变成1&#xff0c;所以当前值x要和前面的值两两and为0意味着&#xff0c;你要使前面的值…

Vim的插件管理器之Vundle

1、安装Vundle插件管理器 Vim可以安装插件&#xff0c;但是需要手动安装比较麻烦&#xff0c;Vim本身没有提供插件管理器&#xff0c;所以会有很多的第三方的插件管理器&#xff0c;有一个vim的插件叫做 “vim-easymotion”&#xff0c;在它的github的安装说明里有列出对于不同…

比ChatGPT更强的星火大模型V2版本发布!

初体验 测试PPT生成 结果&#xff1a; 达到了我的预期&#xff0c;只需要微调就可以直接交付&#xff0c;这点比ChatGPT要强很多. 测试文档问答 结果&#xff1a; 这点很新颖&#xff0c;现在类似这种文档问答的AI平台收费都贵的离谱&#xff0c;星火不但免费支持而且效果也…

vue项目报错:node:internal/modules/cjs/loader:1080

运行项目报错&#xff1a; 原因&#xff1a; 看划线的地方&#xff0c;中文乱码导致找不见模块了 解决方案 将路径上的中文改为英文即可&#xff0c;项目命名最好只有英文、下划线&#xff08;_&#xff09;、数字、横杠&#xff08;-&#xff09;等英文符号组成

MATLAB图形窗口固定

起因是上次作图的时候写了&#xff1a; clc clear close all 这三个典型的刷新语句 清空工作区、命令行并且关闭图窗 就导致每次我把图窗拉到合适的位置观察&#xff0c;再一次点击运行都会重新刷新在出生点&#xff08;x&#xff09; 所以想把图窗固定在某个位置 显然更…

解决爬虫上下行传输效率问题的实用指南

嗨&#xff0c;大家好&#xff01;作为一名专业的爬虫程序员&#xff0c;我们经常会面临上下行传输效率低下的问题。在处理大量数据时&#xff0c;如果传输效率不高&#xff0c;可能会导致爬虫任务速度慢&#xff0c;甚至中断。今天&#xff0c;我将和大家分享一些解决爬虫上下…

深度优先搜索(DFS、深搜)和广度优先搜索(BFS、广搜)

目录 深度优先搜索&#xff08;DFS、深搜&#xff09;和广度优先搜索&#xff08;BFS、广搜&#xff09; 深度优先搜索&#xff08;简称“深搜”或DFS&#xff09; 广度优先搜索 总结 深度优先生成树和广度优先生成树 非连通图的生成森林 深度优先生成森林 广度优先生成…

Python系统学习1-9-类(一)

一、类之初印象 1、类就是空表格&#xff0c;将变量&#xff08;列名&#xff09;和函数&#xff08;行为&#xff09;结合起来 2、创建对象&#xff0c;表达具体行 3、创建类就是创建数据的模板 --操作数据时有提示 --还能再组合数据的行为 --结构更加清晰 4、类的内存分配…

人工智能原理(5)

目录 一、不确定性推理 1、不确定性推理含义 2、知识不确定性的来源 3、不确定推理要解决的基本问题 4、不确定性推理方法分类 二、主观贝叶斯方法 1、主观贝叶斯方法 2、知识不确定性的表示 3、证据 4、不确定性的更新 三、可信度方法 1、可信度模型 2、性质 3、…

RK3588平台开发系列讲解(AI 篇)RKNN C API 详细说明

文章目录 一、API 硬件平台支持说明二、API 函数介绍2.1、rknn_init2.2、rknn_destroy2.3、rknn_query2.4、rknn_inputs_set2.5、rknn_run2.6、rknn_outputs_get2.7、rknn_outputs_release沉淀、分享、成长,让自己和他人都能有所收获!😄 📢本篇章主要讲解 RKNN C API 详细…

DAY3,ARM(LED点灯实验)

1.汇编实现开发板三盏灯点亮熄灭&#xff1b; .text .global _start _start: /**********LED123点灯**************/RCC_INIT:1使能PE10 PF10 PE8RCC..寄存器,E[4]1 F[5]1 0x50000a28ldr r0,0x50000a28ldr r1,[r0]orr r1,r1,#(0x3 << 4)str r1,[r0]LED1_INET:2初始化LED…

保险龙头科技进化论:太保的六年

如果从2013年中国首家互联网保险公司——众安在线的成立算起&#xff0c;保险科技在我国的发展已走进第十个年头。十年以来&#xff0c;在政策指引、技术发展和金融机构数字化转型的大背景下&#xff0c;科技赋能保险业高质量发展转型已成为行业共识。 大数据、云计算、人工智…

通用Makefile的使用及解析

文章目录 前言一、源码使用1、工程预览2、使用通用 Makefile 方法 二、源码编译1、编译2、EXTRA_CFLAGS 和 CFLAGS_xxx.o 三、通用 Makefile 的解析1、Makefile.build 文件2、通用 Makefile 的设计思想&#xff1a;3、情景演绎 四、资源自取 前言 欣赏一下韦东山老师写的通用 …