【论文阅读】NeROIC:在线图像集合中对象的神经渲染

news2025/4/25 8:24:30

论文连接: NeROIC: Neural Rendering of Objects from Online Image Collections

introduction

从在线图像集合中获取对象表示的新颖方法,从具有不同相机、照明和背景的照片中捕获任意对象的高质量几何形状和材料属性。这使得各种以对象为中心的渲染应用程序成为可能,例如新颖的视图合成、重新照明以及来自具有挑战性的野外输入的协调背景合成。

  • 使用扩展神经辐射场的多阶段方法,我们首先推断表面几何形状并细化粗略估计的初始相机参数,同时利用粗略的前景对象掩模来提高训练效率和几何质量。
  • 我们还引入了一种强大的法线估计技术,可以消除几何噪声的影响,同时保留关键细节。
  • 最后,我们提取表面材料属性和环境照明,以球谐函数表示,并具有处理瞬态元素(例如锐阴影)的扩展。

这些组件的结合产生了高度模块化且高效的对象获取框架。广泛的评估和比较证明了我们的方法在捕获对渲染应用程序有用的高质量几何和外观属性方面的优势

我们从在线图像中捕获对象的结果。 我们基于 NeRF 的模块化方法仅需要稀疏、粗略分割的图像来描绘在广泛变化的条件下捕获的对象(左上)。我们首先使用神经渲染(右上)将几何形状推断为密度场,然后计算对象的表面材质属性和每个图像的照明条件(中)。我们的模型不仅可以合成新颖的视图,还可以在新颖的环境和照明条件下重新照明和合成捕获的对象(底部)

可以在购物网站上或通过简单的图像搜索在线找到许多具有相同物体(例如家具、玩具、车辆)的图像集合。非常需要将这些对象与周围环境隔离并捕获高保真结构和外观的能力,因为它可以实现诸如从图像中数字化对象并将其混合到新背景等应用。然而,这些集合中物体的单个图像通常是在高度可变的背景、照明条件和相机参数下捕获的,使得专门为来自受控环境的数据设计的物体数字化方法不适合这种野外设置。在这项工作中,我们寻求通过扩展神经对象渲染的最新进展,开发一种从无约束图像集合中捕获和重新渲染对象的方法来解决这一挑战。

最近使用隐式 3D 场景表示的较著名的作品之一是神经辐射场 (NeRF) 模型 [ 22 ],它学习从稀疏校准图像中表示静态场景的局部不透明度和与视图相关的辐射度,从而实现高质量的新颖视图综合(NVS)。虽然在提高 NeRF的质量和功能方面取得了实质性进展(例如移动或非刚性内容 [29,26,14,41 ] ),但仍然存在一些重要的要求 - 合成背景对象的新颖视图应查看并固定照明条件,并且应在单个会话中捕获多视图图像或视频序列。

最近,一些作品 [ 6,20,3,4,49,43 ]扩展了 NeRF,并在将场景渲染分解为语义上有意义的组件(包括几何、反射率、材质和照明)方面取得了令人印象深刻的进展,从而实现了灵活的交互使用这些组件中的任何一个,例如重新照明和交换背景。不幸的是,他们都没有建立一个全面的解决方案来解决从现实世界、野外图像集合中捕获的对象的局限性。

在这项工作中,我们提出了NeROIC,一种对在线图像集合中的对象进行神经渲染的新颖方法。我们的对象捕获和渲染方法建立在神经辐射场的基础上,具有几个关键功能,可以从在截然不同的条件下捕获的稀疏图像中进行高保真捕获,这​​在在线图像集合中很常见,其中包含使用不同的照明、相机、环境拍摄的单个图像,和姿势。每个图像唯一预期的注释是粗略的前景分割和粗略估计的相机参数,至关重要的是,我们可以从运动结构框架(例如 COLMAP [33])以无监督且无成本的方式 获得这些参数。

我们基于学习的方法的关键是引入模块化方法,其中我们首先优化 NeRF 模型来估计几何形状并细化相机参数,然后推断最能解释图像的表面材料属性和每幅图像的照明条件。捕获的图像。这些阶段的解耦使我们能够使用第一阶段的深度信息在第二阶段进行更有效的光线采样,从而提高材质和照明估计质量和训练效率。此外,由于我们方法的模块化,我们还可以在第一阶段单独利用从几何体初始化的表面法线,并通过新的法线提取层进行创新,以提高获取底层对象材料的准确性。我们的方法概述如图 2 (b) 所示。

为了评估我们的方法,我们创建了几个野外对象数据集,包括我们自己在不同环境中捕获的图像,以及从在线资源收集的对象图像。在这些具有挑战性的设置中,与最先进的替代方案的比较表明,我们的方法在质量和数量上都优于替代方案,同时仍然保持可比的训练和推理效率。图 1展示了我们的方法的一组示例对象捕获和应用结果。

一种新颖的模块化管道,用于从在不同条件下捕获的物体推断几何和材料属性,仅使用稀疏图像、前景掩模和粗糙相机姿势作为附加输入,

一种新的多阶段架构,我们首先提取几何形状并细化输入相机参数,然后推断对象的材料属性,我们证明它对不受限制的输入具有鲁棒性,

一种从神经辐射场估计法线的新方法,使我们能够比更标准的替代技术更好地估计材料属性并重新照亮物体,

包含在变化和具有挑战性的环境和条件下捕获的物体图像的数据集,

使用这些和其他已建立的数据集进行广泛的评估、比较和结果,展示了通过我们的方法获得的最先进的结果。

方法

所有这些方法都不可避免地容易受到复杂阴影输入的影响,即尖锐的阴影和镜面反射,因为它们仅包含一个相对简单的基于物理的渲染器。虽然我们并不声称要学习如何在我们的方法中适应这些阴影,但在我们的工作中,我们引入了基于 [ 49 ]的瞬态组件来识别它并将其与环境照明分开,从而获得对象的无偏差材料属性。据我们所知,我们是第一个基于 NeRF 的方法,可以通过来自互联网的完全不受约束的图像来推断目标的几何形状和材料参数。

在这里插入图片描述
在第一阶段,我们通过学习指示物理内容的密度场来估计对象的几何形状(第 3.3节)。在此阶段,我们还学习静态和瞬态辐射值,以允许基于图像的监督,但不会将此信息完全分解为材质和照明属性。我们还优化相机的姿态和内在参数,以细化作为输入提供的粗略估计。

在第二阶段,我们修复学习的几何形状并优化在任意照明条件下重新渲染对象所需的表面材质和照明参数(第 3.5 节 )。在此阶段,我们使用从相机到物体表面的估计距离来改进沿相机光线的点采样。我们还优化了表面法线,这改进了从密度场获得的粗略估计(第 3.4节)。

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1192036.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

AI:78-基于深度学习的食物识别与营养分析

🚀 本文选自专栏:人工智能领域200例教程专栏 从基础到实践,深入学习。无论你是初学者还是经验丰富的老手,对于本专栏案例和项目实践都有参考学习意义。 ✨✨✨ 每一个案例都附带有在本地跑过的代码,详细讲解供大家学习,希望可以帮到大家。欢迎订阅支持,正在不断更新中,…

ssm+vue的疫情防控管理系统设计与实现(有报告)。Javaee项目,ssm vue前后端分离项目。

演示视频: ssmvue的疫情防控管理系统设计与实现(有报告)。Javaee项目,ssm vue前后端分离项目。 前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到网…

【AI】生成模型变得简单:了解它们的工作原理和不同类型

什么是生成模型? 在不断发展的人工智能领域,生成模型已成为人工智能技术最具吸引力和创造力的方面之一。这些模型是创意人工智能的核心,它们有能力生成各种内容,从栩栩如生的图像和引人入胜的文本到令人着迷的音乐和创新的艺术作…

webpack babel

构建工具 简介 当我们习惯了在node中编写代码的方式后,在回到前端编写html、css、js这些东西会感觉到各种的不便。比如:不能放心的使用模块化规范(浏览器兼容性问题)、即使可以使用模块化规范也会面临模块过多时的加载问题。我们…

MySQL字符串需要注意的事项

char(N),N在0-255间 varchar(N),N在0-65536间 需要注意N是字符,不是字节,英文字母一个字符一个字节,阿拉伯字母一个字符两个字节,中文日文一个字符三个字节,emoji是一个字符四个字节 当今移动端…

跨境电商:自养买家账号测评,你需要了解的细节

在跨境电商的浪潮中,自养买家账号测评已经成为了一种趋势。近期,不少跨境卖家咨询自养买家账号测评的相关问题,看来有必要再讲解一下卖家测评的一些细节。今天将着重介绍自养号测评的相关内容。 首先,什么叫做自养号测评呢&#x…

创建云端服务器

1.申请云端服务器 每个账户有三个月的免费试用 我的服务器选择是centos7 ,别选成win了。 2.创建实例 创建实例的步骤,阿里云有文档 介绍 大致就是 左边点实例 -》 顶部选你申请服务器时的地区-》下面就出现一条实例-》点更多 -》要重置实例密码 -》同一…

海康工业相机如何提高相机帧率

影响帧率的因素 相机参数 帧率限制使能 像素格式 曝光时间 数据包大小(网口) 相机默认参数 ADC位深 系统环境设置

React进阶之路(四)-- React-router-v6、Mobx

文章目录 ReactRouter前置基本使用核心内置组件说明编程式导航路由传参嵌套路由默认二级路由404路由配置集中式路由配置 Mobx什么是Mobx环境配置基础使用计算属性(衍生状态)异步数据处理模块化多组件数据共享 ReactRouter 前置 在一开始前端开发都是单…

HBuilderX 运行Android App项目至雷电模拟器

一、下载安装HBuilderX HBuildeX官网 安装最新的正式版,或者点击历史版本查看更多版本;【ps:Alpha版本为开发版,功能更多,但是也不稳定,属于测试版本】 直接将压缩包解压,运行HBuildeX即可。 二…

凯美瑞 vs 太空船:Web3 游戏生长的两条路径

撰文:Teng Yan(0xPrismatic),Delphi Digital 研究员 编译:TinTinLand 来源:https://0xprismatic.substack.com/p/my-short-web3-gaming-thesis 经常有人问我关于 Web3 游戏的看法,所以我想以这…

文本生成高精准3D模型,北京智源AI研究院等出品—3D-GPT

北京智源AI研究院、牛津大学、澳大利亚国立大学联合发布了一项研究—3D-GPT,通过文本问答方式就能创建高精准3D模型。 据悉,3D-GPT使用了大语言模型的多任务推理能力,通过任务调度代理、概念化代理和建模代理三大模块,简化了3D建模的开发流程…

vmware16.2内部win7联网

1、主机配置 前置条件:DHCP和NAT服务已启动 设置无线IP与虚拟机IP为自动获取 二者都是:右键-属性 选择IPv4 自动获取 2、虚拟机配置 设置虚拟机上网方式为NAT 菜单栏-虚拟机-设置 NMnet8改为NAT模式 菜单栏-编辑-虚拟网络编辑器 win7系统内部网…

Facebook广告被暂停是什么原因?广告账号被封怎么办?

许多做海外广告投放的小伙伴经常遇到一个难题,那就是投放的Facebook广告被拒或广告帐户被关闭赞停的经历,随之而来的更可能是广告账户被封,导致资金的损失。本文将从我自身经验,为大家分享,FB广告被暂停的原因有哪些&a…

Java多线程interrupt、interrupted、isInterrupted详解

一、概念 1.1 interrupt方法应用场景 用来打断正在阻塞的线程:sleep/wait/join打断正常的线程 1.2 interrupt() 方法 Thread类的实例方法,其作用是中断此线程(此线程不一定是当前线程,而是指调用该方法的Thread实例所代表的线程…

【手写模拟Spring底层原理】

文章目录 模拟Spring底层详解1、结合配置类,扫描类资源1.1、创建需要扫描的配置类AppConfig,如下:1.2、创建Spring容器对象LyfApplicationContext,如下1.3、Spring容器对象LyfApplicationContext扫描资源 2、结合上一步的扫描&…

oracle11G在linux环境下的卸载操作

1.使用SQL*PLUS停止数据库 [oracleOracleTest oracle]$ sqlplus / as sysdba SQL> shutdown [immediate] SQL> exit2.停止Listener [oracleOracleTest oracle]$ lsnrctl stop3.停止HTTP服务 [rootOracleTest /root]# service httpd stop4.用su或者重新登录到root(如想…

bootstrap-fileinput拦截文件上传处理失败,根据后台返回数据处理

bootstrap-fileinput如何拦截后台数据,自定义处理业务逻辑 需要后台返回error字段,失败示例,注意:error必须有内容,不然默认也是成功, bootstrap-fileinput失败验证只需要 error 字段,其他附加…

【MySQL习题】各个视频的平均完播率【全网最详细教学】

目录 数据表描述 问题描述 输出示例 解题思路【重点】 正解代码 数据表描述 有以下两张表: 表1:用户-视频互动表tb_user_video_log 数据举例: 说明: uid-用户ID,video_id-视频ID start_time-开始观看时间end_time-结束观…

微信小程序报request:fail url not in domain list的解决方法

情况1:未设置合法域名 解决方法:请在微信公众平台登录小程序后台 > 开发管理 > 开发设置 > 服务器域名 情况2:设置了合法域名,开发工具仍然报错 解决方法: 在右上角点击详情,之后刷新一下项目配置,看看有…