仅用三张图片实现任意场景三维重建:ReconFusion

news2024/12/24 2:37:48

论文题目:

ReconFusion: 3D Reconstruction with Diffusion Priors

论文作者:

Rundi Wu, Ben Mildenhall, Philipp Henzler, Keunhong Park, Ruiqi Gao, Daniel Watson, Pratul P. Srinivasan, Dor Verbin, Jonathan T. Barron, Ben Poole, Aleksander Holynski

项目地址:https://reconfusion.github.io/

编译:lean_loves_lulu

图片

基于NeRF技术的三维重建是目前计算机视觉和图形渲染领域的研究热点,但是每次重建不仅需要从零开始,甚至需要上百张图片作为输入才能完成高保真度的三维重建任务。ReconFusion通过在三维重建过程中加入扩散模型作为先验来减少输入图片数量,利用少量视图信息即可完成高质量场景渲染与重建,为三维重建领域提供了新的研究方向。

图片

▲图1|ReconFusion与Zip使用少量视图进行三维重建对比 ©️【深蓝AI】编译

图片

基于神经辐射场(NeRF)的三维重建很擅长于不同视角下场景的高质量渲染,然而对于复杂场景的高质量重建通常需要数十张甚至上百张输入图像,这无疑是一个极为耗时的过程。本文提出的ReconFusion仅用少量图片即可重建真实场景。具体方法为:利用扩散先验进行新视图的合成,并在人工合成和多视图数据集上进行训练,并将扩散先验信息融合进NeRF的三维重建过程中。

本文提出的方法在多种真实场景数据集上与基于NeRF的重建方法进行了详细的对比实验,实验结果表明:ReconFusion不仅能在欠约束区域内还原真实场景的纹理和几何形状,同时还能保留观察区域内的场景外观,证明了本文提出的方法在少量图像的三维重建方面比NeRF具有更为优秀的性能表现。

图片

图片

▲图2|ReconFusion模型整体框架(来源:该论文)©️【深蓝AI】编译

3.1 Diffusion Model for Novel View Synthesis(用于新视图合成的扩散模型)

扩散模型基于LDMs(Latent Diffusion Models)实现对高分辨率图像的建模。LDMs使用预先训练好的自编码器VAE(Variational auto-encoder)将输入图像编码为潜在空间表示(latent representation),这里可以理解为对输入数据进行压缩,在较低维度上对数据进行表示。扩散模型具体实现为time-conditional UNet,在该扩散模型的基础上引入了条件机制,与Zero-1-to-3类似,将图像位姿作为UNet框架中额外的条件限制,使其能通过不同位姿的图像完成新视图合成任务。

■3.2 3D Reconstruction with Diffusion Priors(基于扩散先验的三维重建)

经过训练后的扩散模型能通过新的相机位姿生成正确的图像,但在使用不同的相机位姿或随机种子时,生成的图像往往不一致。最先进的NeRF方法能生成3D表示一致的三维模型,但通常新视图伴随着”漂浮“现象或出现无法辨认的几何形状。基于上述分析,为了实现利用少量视图作为输入完成三维重建任务,本文使用Zip-NeRF作为三维重建模块,并将扩散模型作为先验加入Zip-NeRF用于新视图合成。

图片

实验分为三部分:首先,将ReconFusion在五个“真实世界”数据集上进行评估,用于验证其在少量视图条件下进行三维重建的性能及可泛化性(对比实验);然后针对于扩散模型及三维重建过程进行消融实验(消融实验);最后在不同的场景捕获条件下验证ReconFusion在三维重建上的最终性能(扩展实验)

■4.1 对比实验

图片

▲图3|ReconFusion在五种真实场景数据集上的对比实验结果(来源:该论文)©️【深蓝AI】编译

图片

▲图4|ReconFusion在五种真实世界数据集上的对比实验结果,即定量分析(来源:该论文)©️【深蓝AI】编译

■4.2 消融实验

对扩散模型的消融实验体现在两个方面:预训练扩散模型权重(PT)和条件信号。分别通过从头开始训练扩散模型和替换PixelNeRF模块(替换为类似于ZeroNVS的模块)进行实现。

首先在扩散模型中选取两个样本,在三种不同条件(限制pose条件下、无预训练权重、完整模型)下基于NeRF进行三维重建,并对渲染结果进行对比分析。

图片

▲图5|扩散模型在三视图三维重建上的消融实验(来源:该论文)©️【深蓝AI】编译

图片

▲图6|消融实验定量分析结果(来源 :该论文)©️【深蓝AI】编译

■4.3 扩展实验

为了进一步研究扩散先验模型的有效性和鲁棒性,将少量视图的条件扩展为不同数量的视图,将本文提出的模型与Zip-NeRF进行对比实验。

图片

▲图7|三维重建扩散损失对比(来源:该论文)©️【深蓝AI】编译

图片

▲图8|有无扩散先验模块对三维重建性能的影响(来源:该论文)©️【深蓝AI】编译

图片

ReconFusion将NeRF和扩散模型进行了有效结合。首先,使用了基于优化的三维重建模块NeRF,保证了算法底层3D表示的多视图一致性。同时,采用了基于扩散模型的新视图合成模块,解决了在三维重建过程中欠约束问题的影响。目前此项研究的局限性也是显而易见的:扩散模型计算成本较高,会明显降低重建速度;模型在三维绘制能力上稍有不足;调整重建与样本损失之间的平衡也较为困难。尽管现阶段的研究在存在一些问题,本文提出的模型已在各类场景中初见成效,视图计算量显著降低,未来工作可以在稀疏重建方向针对于本文模型作进一步的优化与改进。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1389112.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Java - Lombok的添加和使用详解

目录 🐶6.1 lombok介绍 🐶6.2 lombok使用 1. 🥙添加方法一 2. 🥙添加方法2 3. 使用 🐶6.3 lombok常用注解 1. 🥙Getter和Setter 2. 🥙ToString 3. 🥙NoArgsConstructor和Al…

随笔03 笔记整理

图源:文心一言 关于我的考研与信息安全类博文整理~🥝🥝 第1版:整理考研类博文~🧩🧩 第2版:提前列出博文链接,以便小伙伴查阅~🧩🧩 第3版:整理We…

光彩耀新年,戴森美发科技品类,见证成长美一面

龙年将至,祥瑞满天,新年曙光寓意着好运从「头」开始,同时也承载着人们对新一年的期许。值此之际,戴森中国美发科技品类正式发布全新蓝彩朱红色系列产品,为新年注入活力与希望,携手消费者一起开启护发造型新…

力扣hot100 寻找重复数 二分 抽屉原理

Problem: 287. 寻找重复数 文章目录 思路复杂度🎈 Code 思路 👨‍🏫 参考题解 复杂度 时间复杂度: O ( N log ⁡ N ) O(N \log{N}) O(NlogN) 空间复杂度: O ( 1 ) O(1) O(1) 🎈 Code class Solution {public int findDu…

ASP.NET Core列表增删改查

前置要求&#xff1a; 1. vueelement-plus实现前端静态页面 HelloWorld.vue <template><h2>hello界面</h2><div class"tableList"><!-- 搜索框 --><el-row :gutter"20"><el-col :span"8"><!-- 搜…

【备战蓝桥杯】今天给大家整点解压的~

【备战蓝桥杯】今天给大家整点解压的~ 蓝桥杯备赛 | 洛谷做题打卡day8 文章目录 【备战蓝桥杯】今天给大家整点解压的~ 蓝桥杯备赛 | 洛谷做题打卡day8[NOIP2017 普及组] 成绩题目背景题目描述输入格式输出格式样例 #1样例输入 #1样例输出 #1 样例 #2样例输入 #2样例输出 #2 提…

【书生·浦语】大模型实战营——LMDeploy 大模型量化部署实战

大模型部署背景 大模型部署是指将训练好的模型在特定的软硬件环境中启动的过程&#xff0c;使模型能够接收输入并返回预测结果。大模型的内存开销巨大&#xff0c;7B模型仅权重需要14G内存。另外大模型是自回归生成&#xff0c;需要缓存Attention的 k/v。 LMDeploy 简介 推理性…

UE5 UE4 打包报错Failed to compile material 解决

参考&#xff1a;https://forums.unrealengine.com/t/failed-to-compile-material-for-pcd3d_sm5-warning/385087 https://forums.unrealengine.com/t/failed-to-compile-material-for-platform-pcd3d-sm4/436176 报错&#xff1a;Failed to compile Material for platform PC…

基于Java SSM框架实现学生寝室管理系统项目【项目源码+论文说明】计算机毕业设计

基于java的SSM框架实现学生寝室管理系统演示 摘要 寝室管理设计是高校为学生提供第二课堂&#xff0c;而我们所在学院多采用半手工管理学生寝室的方式&#xff0c;所以有必要开发寝室管理系统来对进行数字化管理。既可减轻学院宿舍长工作压力&#xff0c;比较系统地对宿舍通告…

【C#】面向对象的三大特性,还记得吗,简单代码举例回顾

欢迎来到《小5讲堂》 大家好&#xff0c;我是全栈小5。 这是《C#》序列文章&#xff0c;每篇文章将以博主理解的角度展开讲解&#xff0c; 特别是针对知识点的概念进行叙说&#xff0c;大部分文章将会对这些概念进行实际例子验证&#xff0c;以此达到加深对知识点的理解和掌握。…

如何学习three.js

如何学习three.js 前言1. 基础概念场景&#xff08;Scene&#xff09;&#xff1a; three.js中所有物体的容器。你可以把它想象成一个舞台&#xff0c;在这里添加物体、光源等。相机&#xff08;Camera&#xff09;&#xff1a; 决定了哪部分场景会被渲染。最常用的是透视相机&…

Parallel patterns: convolution —— An introduction to stencil computation

在接下来的几章中&#xff0c;我们将讨论一组重要的并行计算模式。这些模式是许多并行应用中出现的广泛并行算法的基础。我们将从卷积开始&#xff0c;这是一种流行的阵列操作&#xff0c;以各种形式用于信号处理、数字记录、图像处理、视频处理和计算机视觉。在这些应用领域&a…

超简单的node爬虫小案例

同前端爬取参数一样&#xff0c;输入三个参数进行爬取 注意点也一样&#xff1a; 注意分页的字段需要在代码里面定制化修改&#xff0c;根据你爬取的接口&#xff0c;他的业务规则改代码中的字段。比如我这里总条数叫total&#xff0c;人家的不一定。返回的数据我这里是data.r…

存内计算技术打破常规算力局限性

目录 前言 关于存内计算 1、常规算力局限性 2、存内计算诞生记 3、存内计算核心 存内计算芯片研发历程及商业化 1、存内计算芯片研发历程 2、存内计算先驱出道 3、存内计算商业化落地 基于知存科技存内计算开发板ZT1的降噪验证 &#xff08;一&#xff09;任务目标以…

linux-部署Samba文件共享服务

linux-部署Samba文件共享服务 1、使用命令安装samba服务和samba客户端 dnf install samba samba-client # 或者 yum install samba samba-client2、配置文件的设置(可提前备份smb.conf) vim /etc/samba/smb.conf [global]workgroup SAMBAsecurity userpassdb backend tdbsam…

芯品荟|电梯外呼面板屏驱市场调研报告

PART ONE 产品简介 - Introduction - 1.电梯外呼面板介绍 电梯外呼面板&#xff0c;用于显示电梯当前位置、运行状态和楼层信息&#xff0c;以便乘客在等待电梯时了解电梯的运行情况。 电梯外呼面板&#xff0c;按显示屏的种类&#xff0c;分为3类&#xff0c;分别是LED屏、L…

Linux Mii management/mdio子系统分析之二 mdio总线-设备-驱动模型分析

Linux Mii management/mdio子系统分析之二 mdio总线-设备-驱动模型分析 &#xff08;转载&#xff09;原文链接&#xff1a;https://blog.csdn.net/u014044624/article/details/123303139 接着上篇文章继续分析mdio子系统&#xff0c;本章主要介绍mdio子系统的驱动模型&#xf…

3.3.2 CSMA/ CD协议

3.3.2 CSMA/ CD协议 CSMA/CD&#xff08;Carrier Sense Multiple Access with Collision Detection&#xff09;&#xff1a;载波监听多点接入/碰撞检测。 检测到碰撞后&#xff1a; 适配器立即停止发送。&#xff08;碰撞点后面的信号会一直叠加&#xff09;等待一段随机时间…

【AI】 AIOTSummary

智能物联网(AIoT)是2018年兴起的概念,指系统通过各种信息传感器实时采集 各类信息(一般是在监控、互动、连接情境下的),在终端设备、边缘域或云中心 通过机器学习对数据进行智能化分析,包括定位、比对、预测、调度等。智能物联网(AIoT)是2018年兴起的概念,指系统通过…

你还没脱单,这些软件都得背锅

不管你是否认可情人节概念&#xff0c;是否会在这天与自己的那个ta相聚&#xff0c;每个成年人都会或多或少地思考自己的感情问题。 在互联网兴盛之前&#xff0c;人与人的交往大都依靠职场关系和熟人介绍来结识新的对象&#xff0c;但也有媒人、婚姻介绍所等专门的职业为适龄…