Nerf相关研究

news2024/11/15 13:29:49

1.Nerf相关研究

随着Luma AI的到来,再次将Nerf推向浪尖,实用性进一步得到强化。Nerf仍以极速的发展速度前行,越来越多的研究方向不断涌现。

4K-Nerf

4K-NeRF: High Fidelity Neural Radiance Fields at Ultra High Resolutions
论文:https://arxiv.org/abs/2212.04701
Git:https://github.com/frozoul/4K-NeRF
效果:
https://user-images.githubusercontent.com/15401551/206893643-a4c09b2b-fb7b-4af9-aa4c-8acf006f4e07.mp4

在本文中,我们提出了一个名为4K-NeRF的新颖而有效的框架,以神经辐射场(NeRF)的方法为基础,在超高分辨率的挑战性场景下追求高保真视图合成。基于nerf的方法的渲染过程通常依赖于逐像素的方式,其中光线(或像素)在训练和推理阶段都是独立处理的,这限制了其描述细微细节的表示能力,特别是在提升到极高分辨率时。我们通过探索射线相关性来提高高频细节的恢复来解决这个问题。特别是,我们使用3d感知编码器在低分辨率空间中有效地建模几何信息,并通过3d感知解码器恢复精细细节,条件是由编码器估计的光线特征和深度。与基于补丁的采样的联合训练进一步促进了我们的方法在像素级损失之外纳入基于感知的正则化监督。得益于几何感知局部环境的使用,与现代NeRF方法相比,我们的方法可以显著提高高频细节的渲染质量,并在4K超高分辨率场景下实现最先进的视觉质量。

作者提出了一种扩展NeRF方法以生成超高分辨率3D场景的方法。通过实现更逼真的3D场景的生成,有望应用于VR/AR和电影制作等领域。

Zip-NeRF

Zip-NeRF: Anti-Aliased Grid-Based Neural Radiance Fields
Zip-NeRF: Anti-Aliased Grid-Based Neural Radiance Fields
论文:https://arxiv.org/abs/2304.06706
代码:https://jonbarron.info/zipnerf/
通过在 NeRF 从空间坐标到颜色和体积密度的学习映射中使用基于网格的表示,可以加速神经辐射场训练。然而,这些基于网格的方法缺乏对比例的明确理解,因此经常引入锯齿,通常以锯齿或场景内容缺失的形式出现。mip-NeRF 360 之前已经解决了抗锯齿问题,其原因是沿圆锥体的子体积而不是沿射线的点,但这种方法本身与当前基于网格的技术不兼容。我们展示了如何使用来自渲染和信号处理的想法来构建一种技术,该技术将 mip-NeRF 360 和基于网格的模型(例如 Instant NGP)相结合,产生的错误率比任何一种现有技术都低 8% - 76%,并且训练速度比 mip-NeRF 360 快 22 倍。

NeRF-Art

NeRF-Art: Text-Driven Neural Radiance Fields Stylization
论文:https://arxiv.org/abs/2212.08070
代码:https://github.com/cassiePython/NeRF-Art
NeRF-Art:文本驱动的神经辐射场风格化

  1. 提出NeRF-Art,一种基于文本指导的NeRF渲染方法,可以用简单的文本提示来操纵预训练NeRF模型的风格;
  2. 提出一种新的全局局部对比学习策略,结合定向约束,可同时控制目标样式的轨迹和强度。
  3. 采用权重正则化方法减少密度场在几何渲染时容易出现的多云现象和几何噪声。

SPIn-NeRFS

SPIn-NeRFS: Multiview Segmentation and Perceptual Inpainting with Neural Radiance Fields
论文:https://arxiv.org/abs/2211.12254

SPIn-NeRF

通过用户设置的点去标定图像中的物体,并在后续重建出无标定物体的三维场景(文中称该任务为3D inpainting),同时提出一种新的数据集衡量模型性能。

神经辐射场(Neural Radiance Fields, nerf)已成为一种流行的新视图合成方法。虽然NeRF正在迅速适应更广泛的应用程序,直观地编辑NeRF场景仍然是一个开放的挑战。一个重要的编辑任务是从3D场景中移除不需要的物体,这样被替换的区域在视觉上是合理的,并且与它的背景一致。我们把这个任务称为3D上漆。在3D中,解决方案必须在多个视图中保持一致,并且在几何上有效。在本文中,我们提出了一种新的3D图像绘制方法来解决这些挑战。我们的框架首先在单个输入图像中给定一小组姿势图像和稀疏注释,快速获得目标物体的3D分割掩码。使用掩模,然后引入基于感知优化的方法,利用学习的2D图像画家,将其信息提取到3D空间,同时确保视图一致性。我们还通过引入由具有挑战性的现实场景组成的数据集,解决了缺乏评估3D场景绘画方法的多样化基准的问题。特别是,我们的数据集包含有目标对象和没有目标对象的相同场景的视图,从而可以对3D喷漆任务进行更有原则的基准测试。与基于nerf的方法和2D分割方法相比,我们首先证明了我们的方法在多视图分割方面的优越性。然后,我们评估了3D图像绘制的任务,建立了针对其他NeRF操作算法的最先进性能,以及强大的2D图像绘制基线。

Reference-guided Controllable Inpainting of Neural Radiance Fields

论文:https://arxiv.org/abs/2304.09677
参照指导下的神经辐射场的可控补全

  • 动机:由于神经辐射场在新视图合成方面的流行,人们希望开发神经辐射场的编辑工具。本文旨在提供一种在视角一致且可控的情况下的神经辐射场补全方法。
  • 方法:用单个补全图像和单目深度估计器,通过一个新的渲染技术实现了非参考视角下的一致补全,并采用图像补全方法填补无法监督的区域。
  • 优势:在图像质量和控制性方面有显著改进,用户只需提供一个补全图像即可轻松控制生成的3D场景。

提出一种基于参考图像的神经辐射场补全算法,能在视角一致的情况下,控制补全效果。方法包括使用单个补全图像和单目深度估计器,通过一个新的渲染技术实现了非参考视角下的一致补全,并采用图像补全方法填补无法监督的区域。与其他方法相比,在图像质量和控制性方面有显著改进。
image.png
image.png
image.png

Neural Residual Radiance Fields for Streamably Free-Viewpoint Videos

流媒体自由视点视频的神经剩余辐射场
论文:https://arxiv.org/abs/2304.04452
代码:https://aoliao12138.github.io/ReRF/
Neural Residual Radiance Fields for Streamably Free-Viewpoint Videos

Neural Fields meet Explicit Geometric Representations for Inverse Rendering of Urban Scenes

论文:https://arxiv.org/abs/2304.03266
https://www.youtube.com/watch?linkId=100000197974673&v=1KvHY3tlhhY&feature=youtu.be

基于神经场遇显式几何表示的城市场景逆向渲染

  • 动机:现有的逆渲染方法无法同时处理场景的几何、材质和照明,需要一种新的方法来提高场景重建的质量和效率。
  • 方法:采用一种神经场来描述主要的光线,用显式的网格来建模产生高阶光影效果(如投影阴影)的次要光线,从而实现对场景几何、材质和HDR照明的联合重建。所提出的FEGR方法可以无缝地支持不同场景操作,例如物体插入和光影效果。
  • 优势:FEGR结合了神经场的高分辨率和明确网格表示的高效性,可以从一组定位的RGB图像中提取场景几何、空间变化的材料和HDR照明,并且在各种具有挑战性的数据集上优于现有技术,实现了高保真的光影重构和物体插入等物理场景操作。

提出一种新的逆渲染框架,可以从捕捉到的图像中重建城市场景的几何、材质和高动态范围照明,并实现光影和物体插入等物理场景操作。

VDN-NeRF: Resolving Shape-Radiance Ambiguity via View-Dependence Normalization

论文:https://arxiv.org/abs/2303.17968
代码:https://github.com/BoifZ/VDN-NeRF
我们提出了VDN-NeRF,这是一种训练神经辐射场(nerf)的方法,用于在非朗伯曲面和动态光照条件下获得更好的几何形状,这些条件会导致从不同角度观察时一个点的辐射发生显著变化。而不是明确地建模导致视图依赖现象的潜在因素,这可能是复杂的,但不包括,我们开发了一个简单而有效的技术,通过提取已经编码在学习的nerf中的不变信息来标准化视图依赖。然后,我们联合训练nerf用于视图合成与视图相关的归一化,以获得高质量的几何。我们的实验表明,尽管形状-亮度模糊是不可避免的,但所提出的归一化可以最大限度地减少其对几何形状的影响,这基本上符合解释视图相关变化所需的最佳容量。我们的方法适用于各种基线,并且在不改变体绘制管道的情况下显著改善几何形状,即使数据是在移动光源下捕获的。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1376962.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

写点东西《2024 年决心:更加以开源为中心》

写点东西《2024 年决心:更加以开源为中心》 简而言之1- 使用 Taipy 代替 Tableau 2- 使用 Cal.com 代替 Calendly 3- Plausible 代替 Google Analytics4- AppFlowy 代替 Notion5- Penpot 代替 Figma 6- Fonoster 代替 Twilio 7- NextCloud 替代 Dropbox 8- Jitsi 替…

想寻找Axure的替代品?我们已经试用了10+款设计工具,来看看吧!

Axure是许多产品经理和设计师进入快速原型设计的首选工具,但Axure的使用成本相对较高,学习曲线陡峭,许多设计师正在寻找可以取代Axure的原型设计工具,虽然现在有很多可选的设计工具,但质量不均匀,可以取代A…

平面光波导_三层均匀平面光波导_射线分析法

平面光波导_三层均匀平面光波导_射线分析法 三层均匀平面光波导: 折射率沿 x x x 方向有变化,沿 y y y、 z z z 方向没有变化三层:芯区( n 1 n_1 n1​) > > > 衬底( n 2 n_2 n2​) ≥ \geq ≥ 包层( n 3 n_3 n3​)包层通常为空…

YOLOv8-Seg改进:UNetv2多层次特征融合模块结合DualConv、GSConv

🚀🚀🚀本文改进:多层次特征融合(SDI)结合DualConv、GSConv模块等实现二次创新 🚀🚀🚀SDI 亲测在多个数据集能够实现涨点,同样适用于小目标检测 🚀🚀🚀YOLOv8-seg创新专栏:http://t.csdnimg.cn/KLSdv 学姐带你学习YOLOv8,从入门到创新,轻轻松松搞定…

软件系统培训方案(Word)

1. 培训概述 2. 培训目的 3. 培训对象及要求 3.1. 培训对象 3.2. 培训人员基本要求 4. 培训方式 5. 培训内容 6. 培训讲师 7. 培训教材 8. 培训质量保证 8.1. 用户培训确认报告 8.2. 培训疑问解答 软件开发全文档下载:软件项目开发全套文档下载_软件项目文档-CSDN博…

java项目之留学生交流互动论坛(ssm)

风定落花生,歌声逐流水,大家好我是风歌,混迹在java圈的辛苦码农。今天要和大家聊的是一款基于ssm的留学生交流互动论坛。项目源码以及部署相关请联系风歌,文末附上联系信息 。 项目简介: 管理员:首页、个…

电调相关英文缩写ESC、BEC、PPM、Oneshot125、Oneshot42、Multishot、DShot、ProShot

ESC ESC全称是 Electronic Speed Control 中文翻译成电子调速器,就是电调 BEC BEC全称是 battey elimination circuit 中文翻译成免电池电路 可以理解就是对外供电,BEC就是线性稳压,降压用的,给接收机飞控供电 ESC协议 ESC协议…

K8s---存储卷(动态pv和pvc)

当我要发布pvc可以生成pv,还可以共享服务器上直接生成挂载目录。pvc直接绑定pv。 动态pv需要两个组件 1、卷插件:k8s本生支持的动态pv创建不包括nfs,需要声明和安装一个外部插件 Provisioner: 存储分配器。动态创建pv,然后根据pvc的请求自动…

什么是金融RPA?金融RPA解决什么问题?金融RPA实施难点在哪里?

什么是金融RPA?金融RPA,即金融领域的机器人流程自动化,是一种利用软件机器人来代替人工完成重复性劳动任务的技术。它能够通过模仿最终用户在电脑上的手动操作方式,实现自动化处理大量重复、规则明确的业务流程,如账务…

uniapp 制作 wgt 包(用于 app 的热更新)

升级版本号 修改 manifest.json 的配置,应用版本名称和应用版本号 必须高于上一版的值。 制作 wgt 包 发布 wgt 包 打开 uni-admin 项目的升级中心 上传后会自动生成下载链接 app 的静默热更新 发布新版后,用户打开app,后台会自动下载 wgt…

基于JavaWeb+BS架构+SpringBoot+Vue电影订票系统系统的设计和实现

基于JavaWebBS架构SpringBootVue电影订票系统系统的设计和实现 文末获取源码Lun文目录前言主要技术系统设计功能截图订阅经典源码专栏Java项目精品实战案例《500套》 源码获取 文末获取源码 Lun文目录 1 绪 论 3 1.1研究背景和意义 3 1.2拟解决的问题及特性 3 1.3论文的结构 …

记录一下Canal的错误,主要是top.javatool.canal.client.util下的StringConvertUtil引起的

项目场景: 提示:这里简述项目相关背景: 由于数据库的一个localdatetime字段是空的, 然后修改数据库数据同步canal的时候报了这个错误: Caused by: java.lang.IllegalArgumentException: Can not set java.time.LocalD…

Vue入门五(Vue-CLI项目搭建|vue项目目录介绍|vue项目开发规范|es6导入导出语法)

文章目录 一、Vue-CLI 项目搭建介绍node环境搭建1) 下载与安装2)测试是否安装成功 安装vue-cli安装vue脚手架 创建Vue项目1)使用命令创建项目2)使用图形化界面创建项目 二、vue项目目录介绍1.命令行运行vue项目2.Pycharm中运行项目3.目录结构…

SQL SERVER 19安装 SQL Prompt 10.02版本

SQL Prompt最新版官网下载地址:https://download.red-gate.com/SQLPromptDownload.exe 下载完成后,断开网络,全部点下一步。 注册机会报毒,安装前请先关闭杀毒软件! 下载好附件之后解压,打开SQLPrompt_7…

io.lettuce.core.RedisCommandExecutionException: NOAUTH Authentication required.

报错信息: 浏览器中的报错信息 IDEA中的报错信息 报错原因: SpringBoot整合Redis使用的默认配置,但是我们设置了Redis的密码,而默认配置中密码是为空的,导致不能够连接 浏览器中的报错信息 There was an unexpected …

视频转为序列图的软件,让视频批量转为序列图

你是否曾经遇到过这样的困境:需要将一段视频转为一系列的图片,但却没有合适的工具来完成?或许你曾经手动截图,或者用其他方式,但结果往往不尽如人意,图片质量差、色彩失真、画面不清晰。现在,让…

创建一个简单鸿蒙app项目

文章目录 前言TypeScript 基础类型创建一个鸿蒙app总结 一、前言 鸿蒙系统上的开发已经是趋势了,必须紧跟时代的潮流。先简单了解下鸿蒙系统中,我们开发一个app需要用到的语言,那么就是TypeScript。这篇文章主要讲的就是一些基础的语法。最…

RPA流程自动化能为企业带来多大效益?

机器人流程自动化(RPA)备受各行各业青睐的最重要原因之一就是软件的高度通用性,随着企业对于降本增效的需求越来越旺盛,RPA应用案例的数量和多样性也在不断增加。 因为RPA所适用的行业很多,所以其对企业的效益也是有不…

使用ros_arduino_bridge控制机器人底盘

使用ros_arduino_bridge控制机器人底盘 搭建了ROS分布式环境后,将ros_arduino_bridge功能包上传至Jetson nano,就可以在PC端通过键盘控制小车的运动了。实现流程如下: 系统准备;下载程序;程序修改;分别启动PC与Jetson…

深入探索JavaScript中实用而高级的Rest参数和Spread语法

🧑‍🎓 个人主页:《爱蹦跶的大A阿》 🔥当前正在更新专栏:《VUE》 、《JavaScript保姆级教程》、《krpano》、《krpano中文文档》 ​ ​ ✨ 前言 函数是JavaScript这个语言的核心,而如何处理函数的参数是函数编程中非…