【论文精读】RA-MVSNet:Multi-View Stereo Representation Revisit: Region-Aware MVSNet

news2025/1/9 16:13:05

今天读的是一篇发表在CVPR2023上的文章,作者来自浙大与阿里巴巴。
文章链接:Multi-View Stereo Representation Revisit: Region-Aware MVSNet

目录

  • Abstract
  • 1 Introduction
  • 2 Related Work
  • 3 Method
    • 3.1 Cost Volume Construction
    • 3.2 Signed Distance Supervision
    • 3.3 Volume Fusion
    • 3.4 Supervision of SDF Branch
  • 4 Experiments
    • 4.1 Implementation Setup
    • 4.2 Results on Tanks and Temples
    • 4.3 Results on DTU
    • 4.4 Ablation Studies
  • 5 Conclusion

Abstract

基于深度学习的多视图立体已经成为从多视图重建完整几何细节对象的强大范例。 大多数现有方法仅通过最小化预测点与光线与表面交点之间的间隙来估计像素级深度值,这通常忽略表面拓扑。 这对于无法正确重建的无纹理区域和表面边界至关重要。 为了解决这个问题,我们建议利用点到面的距离,使模型能够感知更广泛的表面。 为此,我们从成本体积预测距离体积,以估计表面周围点的有符号距离。 我们提出的 RA-MVSNet 是补丁感知的,因为通过将假设平面与表面补丁相关联来增强感知范围。 因此,它可以增加无纹理区域的完成度并减少边界处的异常值。 此外,可以通过引入的距离体积生成具有精细细节的网格拓扑。 与传统的基于深度学习的多视图立体方法相比,我们提出的 RA-MVSNet 方法利用符号距离监督获得了更完整的重建结果。 在 DTU 和 Tanks & Temples 数据集上的实验表明,我们提出的方法取得了最先进的结果。

1 Introduction

简介,主要贡献如下:
• 引入采样点的点到面距离监督来扩大模型预测的感知范围,从而实现无纹理区域的完整估计并减少对象边界区域的outliers。
• 为了解决缺乏真实mesh的挑战,我们基于三角网格计算点集之间的有符号距离,这在精度和速度之间进行了trade off。
• 在MVS 数据集上的实验结果表明,提出的方法在室内数据集 DTU 和大规模室外数据集 Tanks and Temples 上均表现最佳。

2 Related Work

介绍了传统MVS和learning-based MVS的工作。

3 Method

在这里插入图片描述

3.1 Cost Volume Construction

和普通MVSNet基本没有差别,只是多使用了Recursive Feature Pyramid结构作为image encoder来获得3个阶段的feature map。

3.2 Signed Distance Supervision

在这里插入图片描述

根据SDF这种隐式表达方式来构建distance volume以预测点到面的距离。

由于引入了距离预测,我们需要将GT从深度图扩展到有符号距离场。 因此,深度图仅包含符号距离为0的采样点,缺乏表面周围点的groundtruth。

对于来自成本体积 C {C} C 的每个假设平面的精确查询点 p i p_{i} pi,我们计算从 p i p_{i} pi 到表面采样点 p ′ p' p 的最短距离,作为有符号距离的GT。 如图 3 所示,我们采用两点距离 d ( p i , p ′ j ) d(p_{i}, p′_{j}) d(pi,pj) 作为 GT 有符号距离。
在这里插入图片描述

为了加快该过程,用局部搜索代替从所有表面采样点寻找最近邻,如图4所示。
这种基于patch的局部搜索方法将需要计算的点保持在合理的范围内尽可能少,从而降低了搜索的时间复杂度。 我们假设深度图的分辨率为 H × W H×W H×W,查询点的数量为 n n n。 那么,朴素计算的时间复杂度是 O ( n × H × W ) O(n×H×W) O(n×H×W),它与深度图的分辨率成正比。 相比之下,基于patch的局部搜索的时间复杂度简化为 O ( n × k × k ) O(n × k × k) O(n×k×k),其中 k k k是patch大小,通常设置为 5 5 5。因此,基于patch的局部搜索的时间复杂度可以简化到 O ( n ) O(n) O(n)。 也就是说,它只与查询点的数量 n n n成正比,并且每个查询点的搜索时间是恒定的。

3.3 Volume Fusion

获得了probability volume和distance volume,现在需要fuse来获得最终的深度图了。一般来说,都是用softmax-based regularization network来预测深度的。
在这里插入图片描述

但该方法由于计算中涉及多个无效平面,存在精度问题。 一个像素(U,V)的深度值仅与该像素对应的几个假设平面有关,而与表面上的其他采样点无法关联。
在这里插入图片描述
如图5所示,我们融合概率体积P和引入的距离体积S来计算深度图,使得每个像素都与周围的表面patch相关。 具体来说,S可以看作是通过阈值对概率值进行过滤。 这两个体积的融合过程如算法 1 所示。最后,我们使用深度图真实值和生成的带符号距离真实值来监督两个体积 P 和 S。我们对深度图和带符号距离采用 L1 损失,如下所示:
在这里插入图片描述

3.4 Supervision of SDF Branch

由于我们从相应的深度图生成点到面距离的真实值,因此误差界限分析是必要的。 一个合理的假设是使用三角网格来表示表面。 存在三种不同情况,如图6所示。
在这里插入图片描述
具体分析可以看论文。

4 Experiments

4.1 Implementation Setup

介绍了训练和测试的配置。

4.2 Results on Tanks and Temples

在这里插入图片描述

4.3 Results on DTU

在这里插入图片描述

4.4 Ablation Studies

介绍了消融实验,主要是以下三个方面。
SDF Branch能很大程度影响精度,因为它能移除outliers。
Local Patch Size也会影响精度,在k增长的时候表现也会更好。
Fusion threshold方面,随着 θ \theta θ的增大,accuracy会变差,但是completeness会变好。

5 Conclusion

总结前文,未来方向是希望只使用SDF来进行MVS,以减小显存开销。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/722998.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

十一、弹性盒flex - 介绍

目录 1.flex介绍 2.详解 一、flex介绍 flex(弹性盒,伸缩盒) css中的又一种布局手段,它主要用来代替浮动来完成页面的布局。flex可以使元素具有弹性,让元素可以跟随页面的大小的改变而改变。 我们知道float&#xff1…

【linux kernel】一文总结linux内核通知链

文章目录 1、通知链简介2、通知链的类型3、原理分析和API(1)注销通知器(2)注销通知器(3)通知链的通知 4、实例代码(1)定义一个通知链(2)实现观察者模块&#…

从源码全面解析 Java SPI 的来龙去脉

一、引言 对于 Java 开发者而言,关于 dubbo ,我们一般当做黑盒来进行使用,不需要去打开这个黑盒。 但随着目前程序员行业的发展,我们有必要打开这个黑盒,去探索其中的奥妙。 虽然现在是互联网寒冬,但乾坤…

数字化转型应该从哪里开始?

数字化转型可能是一个复杂的过程,涉及将数字技术和战略集成到组织的各个方面。虽然具体的起点可能会根据组织的规模、行业和目标而有所不同,但数字化转型计划通常从以下几个共同领域开始: 愿景和战略:转型之旅应从与组织目标一致的…

百万数据SQL优化技巧,看这一篇就够了(实操+详细总结)

前言:这次准备了100W的数据进行SQL性能测试,数据库采用的是MySQL,总共介绍了常见的15种SQL优化方式,每一种优化方式都进行了实打实的测试,逐行讲解,通俗易懂! 目录 一、准备数据 1、创建表结构…

Windows环境下安装和配置python环境

Windows环境下安装和配置python环境 1.官网下载:https://www.python.org/downloads/release 2.安装:自定义路径即可无脑下一步 3.cmd打开控制台,输入python,如果页面切换成以下样子就说明安装成功了 4.运行python脚本【步骤3切入…

555、Vue 3 学习笔记 -【常用Composition API(四)】 2023.07.06

目录 一、setup的两个注意点1. setup执行的时机2. setup的参数 二、 计算属性与监视1. computed函数2. watch函数3. watchEffect函数 三、参考链接 一、setup的两个注意点 1. setup执行的时机 在beforeCreate之前执行一次,this是undefined 2. setup的参数 props…

GitLab名词介绍

GitLab名词介绍 分支:active、stale、default、protected IDEA中git面板:本地、远程、HEAD 合并时的选项:Delete、squash 查看Git常用操作 分支:active、stale、default、protected 在分支页面下,有active、stale…

k8s中kubectl陈述式/声明式资源管理

k8s陈述资源管理方法的说明 1.kubernetes 集群管理集群资源的唯一入口是通过相应的方法调用 apiserver 的接口 2.kubectl 是官方的CLI命令行工具,用于与 apiserver 进行通信,将用户在命令行输入的命令,组织并转化为 apiserver 能识别的信息&…

TongWeb8关于内存泄露提示: To prevent a memory leak

原因: 该问题与 https://blog.csdn.net/realwangpu/article/details/109510297 相同,TongWeb7, TongWeb8在卸载应用时,会尝试回收可能存在的内存泄露, 本质应该从应用方面解决。 解决办法: 若无法修改应用&#xff0c…

深度学习神经网络学习笔记-论文研读-transformer

摘要 优势序列转导模型基于复杂的循环或包括一个编码器和一个解码器的卷积神经网络。最好的表现良好的模型还通过attention 连接编码器和解码器机制。我们提出了一种新的简单的网络架构,Transformer, 完全基于注意力机制,省去了递归和卷积完…

【成都理工826】22年真题及解析

哈喽大家好,鉴于真题系列反馈很不错,我决定重启真题系列!之前更新的22真题合集点击这里: 成都理工826信号与系统难度不是特别大,但是对计算的要求比较高。掌握好基础,计算细心是可以拿高分的。本套试题内容…

【我们一起60天准备考研算法面试(大全)-第四天 4/60(二叉搜索树与表达式树)】【每天40分钟,我们一起用60天准备 考研408-数据结构(笔试)】

专注 效率 记忆 预习 笔记 复习 做题 欢迎观看我的博客,如有问题交流,欢迎评论区留言,一定尽快回复!(大家可以去看我的专栏,是所有文章的目录)   文章字体风格: 红色文字表示&#…

github搜索技巧笔记

一、了解 GitHub Watch按钮 Watch可以理解为关注的意思,默认情况下是Not watching,当选择Watch后,你会收到这个GitHub项目的所有动态。比如:有人发起pull request或者issue等。接收动态方式包括个人通知中心或者邮箱。 如果某个…

TypeScript - 函数(中)

目录 1、编写良好泛型函数的准则 1.1 向下推送类型参数 1.2 使用较少的类型参数 1.3 类型参数应出现两次 2、可选参数 3、回调中的可选参数 4、函数重载 5、重载签名和实现签名 6、写好重载 1、编写良好泛型函数的准则 编写泛型函数很有趣,并且很容易被类…

Kibana对索引库的操作(3)

这里我们主要是对索引库进行各种查询的操作,所以要提前准备一些数据 POST /leq/goods/3 {"title": "小米手机","images": "3.jpg","price": 4299,"stock": 200,"saleable": true,"subTitle":…

读发布!设计与部署稳定的分布式系统(第2版)笔记20_实例层之代码

1. 术语的定义 1.1. 服务 1.1.1. 指共同协作、以单元的形式对外提供功能的跨机器进程集合 1.1.2. 一个服务可以由多种可执行文件组成 1.1.3. 一个服务可能包含来自多个可执行文件的多个进程 1.1.4. 可能对外呈现单个IP地址,并在后台进行负载均衡 1.1.5. 可能有…

潇洒郎: bat文件与vbs文件, 执行命令行命令以及执行时无console, reg文件注册表

截图.bat start snippingtool 锁屏.bat rundll32.exe user32.dll,LockWorkStation redis.bat cd %~dp0 redis-server.exe redis.windows.conf vbs Set ws CreateObject("Wscript.Shell") ws.run "cmd /c C:/Python27/Scripts/ride.bat",vbhide 在上…

记录好项目D23

记录好项目 你好呀,这里是我专门记录一下从某些地方收集起来的项目,对项目修改,进行添砖加瓦,变成自己的闪亮项目。修修补补也可以成为毕设哦 本次的项目是个基于Springboot教务管理系统 一、系统介绍 这个项目是一个简单的教…

Slowhttptest----DoS攻击工具

Slowhttptest----DoS攻击工具 文章目录 slowhttptestcentos下安装slowhttptestUbuntu 20.04 LTS下安装slowhttptest使用 slowhttptest SlowHTTPTest 是依赖 HTTP 协议的慢速攻击 DoS 攻击工具。 工具的设计基本原理是服务器在请求完全接收后才会进行处理。 如果客户端的 HTT…