Aleth-NeRF: Illumination Adaptive NeRF with Concealing Field Assumption

news2024/11/17 15:28:41

Abstract

Aleth-NeRF: 带有隐蔽场假设的照明自适应 NeRF 照明照明标准的神经辐射场(NeRF)范例采用了一种以观察者为中心的方法,将光照和材料反射的各个方面仅仅从3D 点发射纠缠在一起。这种简化的渲染方法在准确建模在不利光照条件下捕获的图像方面提出了挑战,如弱光或过度曝光。受到古希腊发射理论的启发,我们假设视知觉是由眼睛发出的光线造成的,我们稍微改进了传统的 NeRF 框架,以便在具有挑战性的光照条件下训练 NeRF,并在无监督的情况下生成正常光照条件下的新视图。我们引入了“隐蔽场”的概念,它为周围的空气分配透射率值,以考虑照明效果。在黑暗的场景中,我们假设物体发射维持一个标准的照明水平,但是在渲染过程中它们穿过空气时会被减弱。因此,即使在光线昏暗的情况下,“隐蔽场”也会迫使 NERF 学会对物体进行合理的密度和颜色估计。同样,隐藏场可以减轻渲染阶段过度暴露的排放。此外,我们提出了全面的在具有挑战性的光照 条件下捕获的多视图数据集用于评估。我们的代码和建议的数据集可在 https://github.com/cuiziteng/aleth-nerf 查阅。

Introduction

神经辐射场(NeRF)(Mildenhall et al. 2020)已被证明能够有效地从二维图像中理解三维场景并产生新的视图。然而,NERF 及其后续变体的制定假设捕获的图像在正常光下,往往不能在弱光下(Mildenhall et al. 2021)或过度曝光的情况下工作。这是因为vanilla NeRF 是以观察者为中心的,它模拟了从一个位置到观察者的光发射量,而没有解开光照和材料的纠缠(图1(a))(Lyu et al. 2022)。结果,NeRF 算法将黑暗场景解释为三维物体粒子辐射不足,违反了对物体材质和几何形状的估计。在实际应用中,图像通常是在具有挑战性的光照条件下拍摄的。因此,本文的目的是要稍微修改vanilla NERF 的曝光不足和过度场景(under & over-exposure scenes.)。如图1(c,d)所示,提出的 Aleth-NeRF,呈现正常光的新视图尽管是严重的输入图像。
在这里插入图片描述
Figure 1:利用隐蔽场假设,Aleth-NeRF 能够处理弱光和过曝光的多视图图像作为输入,并在自然光照下产生新的视图。

NeRF 中的渲染过程(图1(b))类似于古希腊以观众为中心的发射理论。发射理论忽略了入射光,但假设从眼睛发出的视觉光线以直线传播,并与物体相互作用形成视知觉。因此,一个实体的黑暗仅仅是由物体和眼睛之间的粒子引起的。换句话说,除非隐藏,否则默认情况下所有对象都是可见的。受到这种世界观的启发,我们假设了一个简单但 NeRF 友好的概念,那就是在观看方向上的隐藏场(图1©中的灰色粒子)减弱了发射,使观看者看到了一个低光场。这与标准的 NeRF 设置相反,在 标准NeRF 设置中,空气密度(图1(a)中的白色颗粒)通常为零。引入隐蔽场,赋予空气粒子透过率值,使得 NeRF 能够在弱光条件下准确地估计物体(图1©中的黄色粒子)的颜色和密度,因此在去除隐蔽场时,或者说 Aletheia (αλη θ εlα)1,我们能够在正常光下呈现出新的视图。相反,对于曝光过度的场景,在渲染阶段刻意增加隐藏场可以纠正曝光。
我们提出的方法 Aleth-NeRF 以弱光和过曝光图像作为输入来训练模型,并结合隐藏场学习体积表示。如图1(b)所示,我们在对象和观察者间结合隐藏场共同训练 NERF 。对于弱光场景,我们在渲染阶段移除隐藏场(图1©)。当处理过度曝光的图像时,Aleth-NeRF 会添加隐藏场来抑制过度明亮(图1(d))。我们的贡献概述如下:
①我们提出了 Aleth-NERF,它可以在弱光和过度曝光条件下进行训练,并在正常光下产生新的视图。受到古希腊哲学的启发,我们自然地扩展了vanilla NeRF 的透射功能,通过模拟物体和观察者之间的隐藏场来解释明度降低。
②我们贡献了一个具有挑战性的照明多视图数据集,配对 sRGB 弱光和正常光和过度曝光图像,数据集也将是公开的。
③我们比较了各种图像增强和曝光校正方法和以前的基于 NERF 的方法(Mildenhall et al. 2021)。大量的实验表明,我们的 Aleth-NERF 算法达到了令人满意的增强质量和多视图一致性。

Related work

Novel View synthesis with NeRF
NERF (Mildenhall et al. 2020)被提出用于从一组位置输入图像合成新的视图。由于采用了物理立体渲染方案,NeRF 模型在保持三维几何一致性方面具有独特的优势。此外,已经提出了几种方法来加速和改善 NeRF 训练(Barron 等,2021; Sara Fridovich-Keil 和 Alex Yu 等,2022; Lindell,Martel,and wetzstein 2021; Yu 等,2021; Jain,Tancik 和 Abbeel 2021; Deng 等,2022; M uller 等,2022)。

后者的许多工作集中在改善 NERF 在各种退化条件下的性能,如模糊(Ma et al。2021) ,噪声(Pearl,Treibitz 和 Korman 2022) ,反射(Guo et al。2022) ,光泽表面(Verbin et al。2022) ,水下(Levy et al。2023) ,或使用 NERF 处理超分辨率(Wang et al。2021a; Bahat et al。2022)和 HDR 重建(Xin et al。2021; Jun-Seong et al。2022)在3D 空间。另一项研究扩展了 NERF 在3D 空间中的亮度编辑。一些工作,如 NeRF-W (Martin-Brualla et al。2021) ,侧重于使用不受控制的野外图像渲染 NeRF,其他重新照明工作(Srinivasan et al。2021; Rudnev et al。2022; Zhang et al。2021b)依赖于已知的照明条件,并引入额外的物理元素(即正常,光,反照率等) ,以及这些元素的复杂参数建模。同时,这些方法并不是专门为弱光和过度曝光条件而设计的。

其中,RAW-NeRF (Mildenhall et al. 2021)更接近于我们的工作,提出在 HDR RAW 域渲染 NERF,然后用图像信号处理器(ISP)对渲染后的场景进行后处理,RAW-NeRF 已显示出初步的场景光增强能力,但需要 HDR RAW 数据进行训练,这使得它很难在常用的 sRGB 图像上推广。相反,我们的 Aleth-NERF 可以直接在 sRGB 上渲染曝光下和过曝光图像,并通过一种有效的隐藏场方式将无监督的增强注入到三维空间中。
Enhancement in challenging light conditions
具有挑战性的亮度可能来自多种来源,包括自然光变化(如弱光环境和过于明

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1710941.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

牛客网刷题 | BC101 翻转直角三角形图案

目前主要分为三个专栏,后续还会添加: 专栏如下: C语言刷题解析 C语言系列文章 我的成长经历 感谢阅读! 初来乍到,如有错误请指出,感谢! 描述 KiKi学习了循环&am…

【动态规划】速解简单多状态类问题

目录 17.16 按摩师 题⽬描述: 解法(动态规划): 1. 状态表⽰: 2. 状态转移⽅程: 3. 初始化: 4. 填表顺序 5. 返回值 代码 总结: 213.打家劫舍II(medium&#x…

实践部署 浦语·灵笔2 模型,写作图文并茂的文章

1 初步介绍 XComposer2 相关知识 浦语灵笔2 是基于 书生浦语2 大语言模型研发的突破性的图文多模态大模型,具有非凡的图文写作和图像理解能力,在多种应用场景表现出色,总结起来其具有: 自由指令输入的图文写作能力: 浦…

解读makefile中的延迟变量与即时变量

在 Makefile 中,有两种类型的变量:即时变量(immediate variable)和延迟变量(deferred variable)。 它们在 Makefile 的执行过程中具有不同的特性和行为。 即时变量(Immediate Variable&#x…

adb 连接机顶盒命令

抓机顶盒日志的方法,使用此命令进行抓日志,个别无法抓日志的盒子可以使用此方法 1、安卓9.0版本查询命令 ps -ef |grep com.cm.webos.iptv 2、安卓4.4版本查询命令 ps |grep com.cm.webos.iptv 3、查询顺序:首先进入shell下进行操作 adb she…

php 连接sqlserver步骤

1.首先要确定使用的是sqlserver的哪个版本,比如sqlserver2012 2.确定服务器是64位还是32位的 3.确认一下使用php的哪个版本,比如php7.1 SQL Server 的 Microsoft PHP 驱动程序 Microsoft Drivers for PHP 支持矩阵 - PHP drivers for SQL Server | Mi…

基于遗传优化的货柜货物摆放优化问题求解matlab仿真

目录 1.程序功能描述 2.测试软件版本以及运行结果展示 3.核心程序 4.本算法原理 5.完整程序 1.程序功能描述 基于遗传优化的货柜货物摆放优化问题求解matlab仿真。在一个货架上,初始状态下,随机将货物放在货柜上,优化之后,整…

javaIO流知识点概况

一、前言: 1.1.流的概念: java将输入与输出比喻为"流",英文:Stream. 就像生活中的"电流","水流"一样,它是以同一个方向顺序移动的过程.只不过这里流动的是字节(2进制数据).所以在IO中有输入流和输出流之分,我们理解他们…

GO语言 gin框架 简述

原文地址 基本路由 Go语言中文文档 一、简介 Gin是一个golang的轻量级web框架,性能不错,API友好。 Gin支持Restful风格的API,可以直接从URL路径上接收api参数或者URL参数,也可是使用json或者表单 数据绑定的方式接收参数。 Gin响…

152.找出峰值(力扣)

代码解决 class Solution { public:// 函数用于找到山峰元素的索引vector<int> findPeaks(vector<int>& mountain) {vector<int> result; // 用于存储山峰元素的索引// 遍历数组&#xff0c;从第二个元素到倒数第二个元素for(int i 1; i 1 < mount…

C++ | Leetcode C++题解之第117题填充每个节点的下一个右侧节点指针II

题目&#xff1a; 题解&#xff1a; class Solution { public:void handle(Node* &last, Node* &p, Node* &nextStart) {if (last) {last->next p;} if (!nextStart) {nextStart p;}last p;}Node* connect(Node* root) {if (!root) {return nullptr;}Node *…

数据结构——二叉树的基本应用

在此之前我们已经初步了解了二叉树&#xff0c;在介绍堆的基本应用时&#xff0c;我们已经具体介绍了完全二叉树的基本应用&#xff0c;本章我们介绍二叉树的基本应用&#xff0c;这个不止指的是完全二叉树&#xff0c;而是指泛型的二叉树。 二叉树的基本应用&#xff0c;由于…

NDIS协议驱动(三)

协议驱动程序源自发送请求并处理基础驱动程序的接收指示。 在单个函数调用中&#xff0c;NDIS 协议驱动程序可以在每个 NET_BUFFER_LIST 结构上发送具有多个 NET_BUFFER 结构的多个NET_BUFFER_LIST结构。 在接收路径中&#xff0c;协议驱动程序可以接收NET_BUFFER_LIST结构的列…

宝塔部署Java+Vue前后端分离项目

1. 服务器 服务器选择Linux的CentOS7的版本 2. 宝塔Linux面板 2.1 百度搜索宝塔 2.2 进去之后点击立即免费安装 2.3 选择Linux在线安装&#xff0c;输入服务器信息进行安装(也可以选择其他方式) 安装完成之后会弹一个宝塔的应用面板&#xff0c;并附带有登录名称和密码&…

Hugging face win使用教程(二)

1. 将环境迁移到win&#xff0c;可以直接下载修改好的cuda环境https://download.csdn.net/download/liangjiubujiu/89368302?spm1001.2014.3001.5503 2. 修改hugging face的缓存路径 3. 重启pycharm 4. 编写测试代码&#xff0c;注意可能由于网络链接问题&#xff0c;需要关…

OSINT 与心理学:通过开源情报进行剖析和行为分析

在不断发展的心理学领域&#xff0c;人们越来越认识到通过应用开源情报 (OSINT) 方法取得进步的潜力。OSINT 主要以其在安全和情报领域的应用而闻名&#xff0c;并且越来越多地展示其在心理分析和行为分析方面的潜力。本文探讨了 OSINT 和心理学的迷人交叉点&#xff0c;研究如…

基于BP神经网络和小波变换特征提取的烟草香型分类算法matlab仿真,分为浓香型,清香型和中间香型

目录 1.算法运行效果图预览 2.算法运行软件版本 3.部分核心程序 4.算法理论概述 5.算法完整程序工程 1.算法运行效果图预览 2.算法运行软件版本 matlab2022a 3.部分核心程序 ...................................................................................... …

AURIX TC3xx单片机介绍-启动过程介绍3

如下的内容是英文为主,对于TC3xx芯片启动原理不清楚的,可以给我留言,我来解答你们的问题! 3.2.1 Reset类型识别 Reset类型的识别是用来判断上次的复位是Application Reset还是System Reset还是CPU0 Reset。基于复位的原因,启动软件会运行不同的分支逻辑。复位原因可以通…

每日两题 / 131. 分割回文串 42. 接雨水(LeetCode热题100)

131. 分割回文串 - 力扣&#xff08;LeetCode&#xff09; 数据量较小&#xff0c;考虑直接暴力&#xff0c;每次dfs&#xff1a;以bg作为左区间&#xff0c;往右遍历&#xff0c;找到一段回文串区间后&#xff0c;将回文串插入vector<string>&#xff0c;并以下一个下标…

【最优化方法】实验一 熟悉MATLAB基本功能

实验一  熟悉MATLAB基本功能 实验的目的和要求&#xff1a;在本次实验中&#xff0c;通过亲临使用MATLAB&#xff0c;对该软件做一全面了解并掌握重点内容。 实验内容&#xff1a; &#xff11;、全面了解MATLAB系统 &#xff12;、实验常用工具的具体操作和功能 学习建…