NeRF in the Wild: Neural Radiance Fields for Unconstrained Photo Collections

news2024/11/15 11:58:53

NeRF in the Wild: Neural Radiance Fields for Unconstrained Photo Collections(野外的 NERF: 用于无约束照片采集的神经辐射场)

Abstract

我们提出了一种基于学习的方法来合成新的视图的复杂场景使用只有非结构化的收集野生照片。我们建立在神经辐射场(neRF)的基础上,它使用多层感知机的权重来模拟场景的密度和颜色作为三维坐标的函数。虽然 NERF 能够很好地处理在受控环境下捕捉到的静态图像,但是它无法在不受控的图像中建模许多普遍存在的、真实的现象,例如可变光照或瞬态遮挡。我们引入了一系列的扩展,以解决这些问题,从而能够从互联网上采集的非结构化图像进行精确的重建。我们应用我们的系统,称为 NeRF-W,互联网照片收集的著名地标,并证明了时间一致的新颖视图渲染显着更接近于照片现实主义比先前的先进技术来说。

4. NeRF in the Wild

现在,我们介绍一个从野外照片集中重建3D 场景的系统 NeRF-W。我们建立在 NeRF的基础上,并引入了两个明确设计用于处理无约束图像的挑战的增强。

类似于 NeRF,我们从已知相机参数的非结构化照片集合在这里插入图片描述
中学习体积密度表示 Fθ。NERF 在其输入视图中假定了一致性: 在三维空间中,从同一位置和两幅不同图像的观察方向观察到的一个点具有相同的亮度。但是由于两种截然不同的现象,互联网照片(如图2所示)违背了这一假设:在这里插入图片描述

图2:用于训练 NeRF-W 的来自摄影旅游数据集的野外照片示例[13]。由于可变光照和后期处理(顶部) ,同一物体的颜色可能会因图像而异。野外拍摄的照片也可能包含暂时闭塞的主题(底部)。

1) Photometric variation:

在户外摄影中,一天的时间和大气条件直接影响场景中物体的照度(因此,辐射)。由于自动曝光设置、白平衡和跨照片色调映射的变化可能导致额外的光度不一致,因此摄影成像管道加剧了这个问题

2) Transient objects:

真实世界的地标很少被孤立地捕捉没有移动的物体或遮挡物围绕着它们。地标性建筑的旅游照片尤其具有挑战性,因为它们通常包含人物和其他行人的造型。

我们提出了两个模型组件来解决这些问题。在第4.1节中,我们扩展了 NeRF,允许图像相关的外观和照度变化,如图像之间的光度差异可以明确建模。在第4.2节中,我们进一步扩展了这个模型,允许对瞬态对象进行联合估计,并从三维世界的静态表示中解脱出来。图3显示了所提议的模型体系结构的概述。
在这里插入图片描述
图3: NeRF-W 模型架构。给定一个3D 位置,观察方向,学习外观和瞬态嵌入,NeRF-W 产生静态和瞬态颜色和密度以及测量不确定性。请注意,静态不透明度是在模型以外观嵌入为条件之前生成的,以确保所有图像共享静态几何图形。

4.1. Latent Appearance Modeling(潜在外观建模)

为了适应 NERF 对可变光照和光度后处理的要求,我们采用了生成潜在优化(Generative Latent Optimization (GLO))的方法,给每个图像 Ii赋予一个相应的长度为 n ^(a)的实值外观嵌入向量 Li ^(a) 。我们将方程(1)中与图像无关的辐射度 c (t)替换为与图像有关的辐射度 ci (t) ,这也将对图像索引 i 的依赖性引入到近似像素颜色 ci帽:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
使用这些外观嵌入作为输入到只发射颜色的网络分支,在一个特定的图像中给我们的模型自由改变场景发射辐射,同时仍然保证3D 几何(由 MLPθ1早期预测)是静态的和共享的所有图像。通过将 n ^(a)设置为一个小值,我们鼓励优化来确定一个连续的空间,其中可以嵌入照明条件,从而使条件之间的平滑插值,如图8所示。在这里插入图片描述
图8: 两个训练图像(左,右)的外观嵌入 l ^(a)之间的插值,导致渲染(中) ,其中颜色和照明被插值,但几何是固定的。注意,训练图像包含渲染中没有出现的人(左)和灯(右)。

4.2. Transient Objects

我们使用两个不同的设计决策来处理瞬态现象: 首先,我们指定在 NeRF 中使用的color-emitting MLP (方程(4))作为我们模型的“静态”头,
在这里插入图片描述
并且我们添加一个额外的“瞬态”头,发射自己的颜色和密度,其中密度允许在不同的训练图像中变化。这使得 NeRF-W 能够重建包含遮挡物的图像,而无需在静态场景表示中引入伪影。其次,我们不假设所有观察到的像素颜色都是同样可靠的,而是允许我们的瞬态头部发射一个不确定场(很像我们现有的颜色和密度场) ,这使得我们的模型能够适应其重建损失,以忽略可能包含遮挡物的不可靠的像素和3D 位置。我们将每个像素的颜色建模为一个各向同性的正态分布,我们将最大化这种正态分布的可能性,并使用与 NeRF 相同的立体渲染方法“渲染”这种分布的方差。这两个模型组件允许 NeRF-W 在没有显式监督的情况下分离静态和瞬态现象。

为了构造我们的瞬态头部,我们在方程(6)的立体渲染公式的基础上,用瞬态对应物 在这里插入图片描述
增加静态密度 σ (t)和辐射率 ci (t) ,
在这里插入图片描述

然后,r (t)的预期颜色成为静态和瞬态分量的 alpha 组合。
我们使用Kendall等人的贝叶斯学习框架来模拟观察到的颜色的不确定性。我们假设观测到的像素强度是固有的噪声(任意的) ,并且进一步假设这种噪声是与输入相关的(异方差的)。在这里插入图片描述
注:各向同性正向分布(isotropic normal distribution)

为了允许场景的瞬态分量在图像之间变化,我们给每个训练图像 Ii 分配一个第二次嵌入的 li ^(τ) ∈ R ^n ^(τ)作为瞬态 MLP 的输入,
在这里插入图片描述
对于 在这里插入图片描述
使用 ReLU 和sigmoid,并且使用软加作为 βi (t)的激活(通过 βmin > 0移位,确保将最小重要性分配给每条射线的超参数)。有关我们完整的模型体系结构的说明,请参见图3。真彩色Ci®在图像 i 中的光线r损失为:在这里插入图片描述
前两项是基于正态分布的(位移)对数亏损概率,其均值为® ,方差为 βi ®2。较大的 βi ®值减弱了分配给像素的重要性,假设它属于某个瞬态对象。第一项被第二项平衡,它对应于正态分布的对数配分函数,排除了 βi ® = ∞的平凡极小值。第三项是 L1正则化子,其乘子 λu 在(非负)瞬态密度 σ (τ) i (t)上,这阻碍了模型用瞬态密度来解释静态现象。

在测试时,我们省略了瞬态和不确定度场,只渲染 σ (t)和 c (t)。有关静态、瞬态和不确定性组件的说明,请参见图4在这里插入图片描述
图4: NeRF-W 分别呈现场景的静态(a)和瞬态(b)元素,然后组合它们©。训练最小化合成图像和真实图像(d)之间的差异,不确定性(e)加权,这是同时优化识别和折扣异常图像区域。

6. Conclusion

我们提出了 NeRF-W,一种基于 NeRF 的非结构化互联网照片集的复杂环境三维场景重建的新方法。我们学习每个图像的潜在嵌入捕获光度外观变化通常存在于野外数据,我们分解场景到图像依赖和共享组件,使我们的模型从静态场景分离瞬态元素。对真实世界(和合成)数据的实验评估表明,与以前的最先进的方法相比,定性和定量方面都有显著的改进。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1620550.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

深度学习算法简介(一)

目录 ⛳️推荐 前言 1、深度神经网络(DNN) 2、卷积神经网络(CNN) 3、残差网络(ResNet) 4、LSTM(长短时记忆网络) 5、Word2Vec 6、Transformer 7、生成对抗网络(…

MySQL常见的约束

什么是约束? 限制,限制我们表中的数据,保证添加到数据表中的数据准确和可靠性!凡是不符合约束的数据,插入时就会失败,插入不进去的! 比如:学生信息表中,学号就会约束不…

【IC设计】奇数分频与偶数分频 电路设计(含讲解、RTL代码、Testbench代码)

文章目录 原理分析实现和仿真偶数分频的电路RTL代码偶数分频的电路Testbench代码偶数分频的电路仿真波形占空比为50%的三分频电路RTL代码占空比为50%的三分频电路Testbench代码占空比为50%的三分频电路仿真波形 参考资料 原理分析 分频电路是将给定clk时钟信号频率降低为div_c…

北斗卫星助力农业生产精准播种

北斗卫星助力农业生产精准播种 随着现代化农业的不断进步,高科技技术的融合已成为推动农业生产向前发展的重要动力。其中,北斗卫星导航系统(BDS)的应用,特别是在农业播种领域的利用,标志着农作物种植方式的…

私域运营的基础是什么?

私域运营是指在自有平台上进行的一系列运营活动,旨在建立和维护与用户的深度互动关系,提升用户忠诚度和品牌影响力。相比于传统的广告投放和推广方式,私域运营更加注重与用户的沟通和互动,通过提供有价值的内容和个性化的服务&…

业务复习知识点Oracle查询

业务数据查询-1 单表查询 数据准备 自来水收费系统建表语句.sql 简单条件查询 精确查询 需求 :查询水表编号为 30408 的业主记录 查询语句 : select * from t_owners where watermeter 30408; 查询结果 : 模糊查询 需求 :查询业…

mysql添加普通索引(简单使用)

前言:以订单表(oms_order)为例,添加用户id(user_id)为普通索引 mysql添加普通索引(简单使用) 1.查看表已经存在的索引情况a.语法b.使用c.结果(这里还没有添加所以&#…

MT3029 战神小码哥

注意点:不能先按时间排序,在每个时间点选最大的。如果第一秒有p11,第二秒有p210和p311,则如果按时间来,则先选第一秒的1,再选第二秒的 11;但是有更优的策略:第一秒选p3,第二秒选p2。…

【1431】java学习网站系统Myeclipse开发mysql数据库web结构java编程计算机网页项目

一、源码特点 java 学习网站系统是一套完善的java web信息管理系统,对理解JSP java编程开发语言有帮助,系统具有完整的源代码和数据库,系统主要采用B/S模式开发。开发环境为TOMCAT7.0,Myeclipse8.5开发,数据库为Mysql5.0&…

ARP 攻击神器:ARP Spoof 保姆级教程

一、介绍 arpspoof是一种网络工具,用于进行ARP欺骗攻击。它允许攻击者伪造网络设备的MAC地址,以欺骗其他设备,并截获其通信。arpspoof工具通常用于网络渗透测试和安全评估,以测试网络的安全性和漏洞。 以下是arpspoof工具的一些…

【考研高数】学习笔记分享

派大星说数学(导学部分) 关于做题 测试 答疑阶段 直播 群内 高中基础知识导学 一、数与式 述了课程学习和因式分解、分式拆解等知识点。学生应了解课程内容,带着疑问听课,不要抄笔记,导学课和基础课都有测验&…

【Linux】LInux下的进程状态

👦个人主页:Weraphael ✍🏻作者简介:目前正在学习c和算法 ✈️专栏:Linux 🐋 希望大家多多支持,咱一起进步!😁 如果文章有啥瑕疵,希望大佬指点一二 如果文章对…

海内外电商平台架构探究:技术与商业的融合

随着全球化进程的加速和互联网的普及,电子商务在海内外市场都蓬勃发展。海外电商平台在连接全球买家和卖家、拓展国际市场方面发挥着重要作用,而国内电商平台则在满足国内消费需求、促进国内经济增长方面扮演着关键角色。本文将探讨海内外电商平台的架构…

常见大厂面试题(SQL)01

知乎问答最大连续回答问题天数大于等于3天的用户及其对应等级 1.描述 现有某乎问答创作者信息表author_tb如下(其中author_id表示创作者编号、author_level表示创作者级别,共1-6六个级别、sex表示创作者性别): author_id author_level sex 101 …

基于STM32的DAC简易信号发生器设计(HAL库)

前言:本文为手把手教学制造 DAC 简易信号发生器的教程,本教程的 MCU 使用 STM32F103ZET6 。以 HAL 库的 DAC 函数作为代码基础进行编程,使得信号发生器可以产生各种类型的信号波,包括:方波、三角波、正弦波和噪声波&am…

Oracle解析exp、imp及常见的问题

前言 在工作中经常需要不同数据库的导入和导出。exp和imp可以实现数据的迁移。 exo会转储产生对应的二进制文件,里面包括数据的定义信息、数据内容等,即为dump文件。 下面是使用exp和imp的一些场景 exp和imp主要有4中模式: 1)数据库模式 数据库模式也就是我们说的全备…

Pytorch 计算深度模型的大小

计算模型大小的方法 卷积 时间复杂度 与 空间复杂度 的计算方式: C 通道的个数,K卷积核大小,M特征图大小,C_l-1是输入通道的个数,C_l是输出通道的个数 1 模型大小 MB 计算模型的大小的原理就是计算保存模型所需要…

sprinboot+人大金仓配置

1. .yml 配置 spring:datasource:type: com.alibaba.druid.pool.DruidDataSource#driverClassName: dm.jdbc.driver.DmDriver## todo 人大金仓driverClassName: com.kingbase8.Driverdruid:## todo 人大金仓master:url: jdbc:kingbase8://111.111.111.111:54321/dbname?cu…

区块链钱包开发——专业区块链开发

随着区块链技术的发展,钱包开发成为了一项至关重要的任务。本文将探讨区块链钱包开发的重要性,分析当前面临的挑战,并展望未来的发展趋势。 一、区块链钱包概述 区块链钱包是一种用于存储和管理数字货币的软件工具。它为用户提供了一个安全的…

巧用断点设置查找bug【debug】

默认设置的断点,当代码运行到断点处MCU就会被挂起,从而停在断点处。 但在某些情况下,如调试FCCU时,如果设置断点,MCU停下后将会导致 FCCU 配置WDG超时。或在调试类似电机控制类的应用时,不适当的断点会导 致…