CVPR2024满分论文:基于可变形三维高斯的高质量单目动态重建方法

news2025/1/11 21:41:31

一、摘要

        隐式神经表征为动态场景的重建和渲染开辟了新的途径。然而,尖端的动态神经渲染方法严重依赖这些隐式表征,它们常常难以捕捉场景中物体的复杂细节。此外,隐式方法通常难以实现动态场景的实时渲染,限制了它们在多种任务中的应用。为了解决这些问题,我们提出了一种可变形的3D高斯喷溅法,该方法利用3D高斯在规范空间重建场景,并通过变形场来模拟单目动态场景。我们还引入了一种无额外开销的退火平滑训练机制,可以减轻不准确姿态对实际数据集中时间插值任务平滑性的影响。通过差分高斯光栅化器,可变形的3D高斯不仅实现了更高的渲染质量,还达到了实时渲染速度。实验表明,我们的方法在渲染质量和速度方面都显著优于现有方法,非常适合新视角合成、时间插值和实时渲染等任务。我们的代码可在以下链接获取:https://github.com/ingra14m/Deformable-3DGaussians。

  • 项目主页:https://ingra14m.github.io/Deformable-Gaussians/

  • 论文链接:https://arxiv.org/abs/2309.13101

  • 代码:https://github.com/ingra14m/Deformable-3D-Gaussians

二、介绍

        从一组输入图像中高质量重建和真实感渲染动态场景对于增强现实/虚拟现实(AR/VR)、3D内容制作和娱乐等多种应用至关重要。过去用于建模这些动态场景的方法主要依赖于基于网格的表示,如文献[9, 14, 18, 40]中所述。然而,这些策略常常面临细节和真实感缺乏、语义信息缺失以及难以适应拓扑变化等固有局限性。随着神经渲染技术的引入,这一范式发生了显著变化。尤其是通过NeRF [28]实现的隐式场景表征,在新视角合成、场景重建和光线分解等任务中展示了令人称赞的效果。

        为了提高基于NeRF的静态场景推理效率,研究人员开发了多种加速方法,包括基于网格的结构[7, 46]和预计算策略[44, 52]。值得注意的是,通过引入哈希编码,Instant-NGP [29] 实现了快速训练。在质量提升方面,mipNeRF [2] 首创了一种有效的抗锯齿方法,后被 zipNeRF [4] 结合到基于网格的方法中。3D-GS [15]最近将基于点的渲染扩展到了具有3D高斯功能的高效CUDA实现中,这使得实时渲染成为可能,其质量甚至超过了Mip-NeRF [2]。然而,这种方法专为表征静态场景而设计,其高度定制的CUDA光栅化流水线限制了其可扩展性。

        隐式表征越来越多地被用于建模动态场景。为了处理动态场景中的运动部分,一些方法[43, 49]将NeRF条件化在时间变量上。相反,非耦合方法[23, 30, 31, 34, 39]采用变形场将场景建模在规范空间中,通过映射给定时间的点坐标到这一空间。这种解耦的建模方法可以有效表征动作变化不剧烈的场景。然而,不论是哪种分类,采用隐式表征来建模动态场景往往既不高效也不有效,表现为收敛速度慢以及极易过拟合。受到开创性NeRF加速研究的启发,许多关于动态场景建模的研究已经整合了离散结构,如体素网格[11, 38]或平面[6, 36]。这种整合提高了训练速度和建模精度。然而,挑战仍然存在。利用离散结构的技术仍然面临实时渲染速度和生成具有足够细节的高质量输出的双重约束。多个方面构成了这些挑战的基础:首先,射线投射作为一种渲染方式,特别是在提升至更高分辨率时,往往变得效率低下;其次,基于网格的方法依赖于低秩假设,与静态场景相比,动态场景显示出更高的秩,这限制了这种方法能够达到的质量上限。

        在本文中,为了解决上述挑战,我们对静态的3D-GS进行了扩展,并提出了一种可变形的3D高斯框架用于建模动态场景。为了增强模型的应用性,我们特别关注单目动态场景的建模。我们不是逐帧重建场景[26],而是将3D高斯条件化在时间上,并且联合训练一个纯隐式变形场与规范空间中的可学习3D高斯。这两个组件的梯度来源于一个定制的差分高斯光栅化流水线。此外,为了解决重建过程中由于姿态不准确引起的时间序列抖动,我们加入了一个退火平滑训练(AST)机制。这种策略不仅改善了时间插值任务中帧与帧之间的平滑性,还允许渲染更多细节。

总结来说,我们工作的主要贡献包括:

  • 一个用于建模单目动态场景的可变形3D-GS框架,能够实现实时渲染和高保真场景重建。
  • 一个新颖的退火平滑训练机制,确保时间平滑性同时保留动态细节,而不增加计算复杂性。
  • 第一个通过变形场扩展3D-GS至动态场景的框架,使得在规范空间学习3D高斯成为可能。

 

        我们方法的概述如图2所示。输入数据是一组单目动态场景的图像,附带时间标签和通过SfM [37] 校准的相应相机姿态,SfM还生成了一个稀疏点云。从这些点云中,我们创建了一组由中心位置x、不透明度σ和通过四元数r和缩放s得到的3D协方差矩阵Σ定义的3D高斯G(x, r, s, σ)。每个3D高斯的视依赖外观通过球形谐波(SH)来表示。为了模拟随时间变化的动态3D高斯,我们将3D高斯和变形场解耦。变形场以3D高斯的位置和当前时间t为输入,输出δx、δr和δs。随后,我们将变形后的3D高斯G(x + δx, r + δr, s + δs, σ)放入高效的差分高斯光栅化管道中,该管道是一个基于瓦片的光栅器,允许各向异性斑点的α混合。通过跟踪累积的α值以及对高斯密度的自适应控制,3D高斯和变形网络通过快速反向传递共同优化。实验结果表明,在30k训练迭代后,3D高斯的形状及其规范空间均已稳定,这间接证明了我们设计的有效性。

三、实验结果展示

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2077912.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Excel公式与图表自动化:在Python中操作Excel公式并自动化生成图表

目录 一、Python操作Excel公式 1.1 读取Excel文件 1.2 识别和处理公式 1.3 批量处理公式 二、自动化生成图表 2.1 使用pandas和matplotlib生成图表 2.2 使用xlwings在Excel中直接生成图表 2.3 自定义图表样式 2.4 自动化生成复杂图表 三、总结 在数据分析和自动化办公…

VMware Workstation Pro for Personal Use (For Windows) 17.0.0

VMware Workstation Pro for Personal Use (For Windows) 17.0.0 弄了半天终于找到下载地址了 现在VMware被博通(broadcom)收购且宣布了17.5版本的VMware Workstation Pro对个人用户免费许可使用。由于现在官网的下载方式有改变,故贴出来一…

【数学分析笔记】第2章第4节收敛准则(4)

2.数列极限 2.4 收敛准则 上节课举了一个例子 a N 1 1 2 p 1 3 p . . . 1 n p a_{N}1\frac{1}{2^{p}}\frac{1}{3^{p}}...\frac{1}{n^{p}} aN​12p1​3p1​...np1​ p > 1 p>1 p>1&#xff0c; { a n } \{a_{n}\} {an​}收敛 0 < p ≤ 1 0<p\le 1 0<p≤…

OpenStack——keystone认证服务

1、作用 认证授权 服务目录 2、组件 keystone-server keystone-DB 3、架构 ①组成 用户认证流程&#xff1a; 1.Horizon为用户提供界面; 2.用户输入用户名密码&#xff0c;有Horizon转发至Keystone做认证授权 ; 3.如果认证鉴权成功&#xff0c;会给用户发放一个临时的unscope…

AIGC:Flux.1 NF4 使用 diffusers 推理

背景介绍 Flux 参数量很大 (包括 ext encoder2, autoencoder, 以及 diffusion model) , 使用Diffusers推理,显存占用 30GB。 有大佬做了 NF4 版本,效果依旧能打。所以本文使用 diffusers 推理 NF4版本的 Flux.1 本文重点 1:flux.1-dev-nf4 国内镜像加速下载 2:依赖环境…

error: undefined reference to `__imp__ZN11QSerialPortC1EP7QObject‘

问题 在qt console程序里使用QSerialPot, 在.pro文件里添加了serialport&#xff0c;在main.cpp里也包含了QtSerialPort/QSerialPort&#xff0c;但是编译报错如下&#xff1a; 原因 serialport模块加错了位置&#xff0c;应该添加到QT后面&#xff0c;而实际添加到CONFIG后…

mybatis-plus中Swagger 模式和Kotlin 模式是什么?

在 MyBatis-Plus 中&#xff0c;Swagger 模式和 Kotlin 模式是为了支持特定技术栈和开发需求的两种配置选项。它们分别针对 API 文档生成和 Kotlin 语言提供了更好的支持和集成。 Swagger 模式 Swagger 模式主要用于生成 API 文档。在 MyBatis-Plus 中启用 Swagger 模式后&am…

视频合并怎么弄?高效方法立即学

记得那次家庭聚会&#xff0c;我翻看着那些珍贵的录像带&#xff0c;突然萌生了一个想法&#xff1a;要是能把这些零散的记忆片段合并成一部完整的影片&#xff0c;那该多好啊&#xff01; 于是我开始了视频合并剪辑的探索之旅。从一开始的手足无措&#xff0c;到逐渐熟悉每一…

linux,ubuntu,使用ollama本地部署大模型llama3,模型通用,简易快速安装

文章目录 前言安装ollama启动ollama运行llama3模型查看ollama列表删除模型通过代码进行调用REST API 前言 在拥有了一条4090显卡后&#xff0c;那冗余的性能让你不得不去想着办法整花活&#xff0c;于是就想着部署个llama3&#xff0c;于是发现了ollama这个新大陆&#xff0c;…

【硬件操作入门】2--GPIO与门电路、二极管三极管、LED电路与操作

【硬件操作入门】2–GPIO与门电路&#xff08;二极管&三极管&#xff09;、LED电路与操作 文章目录 【硬件操作入门】2--GPIO与门电路&#xff08;二极管&三极管&#xff09;、LED电路与操作一、GPIO与门电路1.1、GPIO的应用1.2、GPIO引脚操作1.2.1 设置引脚为GPIO功能…

今日算法:蓝桥杯基础题之“切面条”

你好同学&#xff0c;我是沐爸&#xff0c;欢迎点赞、收藏、评论和关注&#xff01;个人知乎 从今天开始&#xff0c;一起了解算法&#xff0c;每日一题&#xff0c;从 JavScript 的技术角度进行解答&#xff0c;如果你对算法也感兴趣&#xff0c;请多多关注哦。 问题描述 一…

网络维护~2003服务环境

一、2003服务环境 背景&#xff1a;学习测试需要在虚拟机进行实验&#xff0c;主机kali验证开源十大漏洞&#xff0c;部分需要2003服务环境。 博客声明:搭建网络是为了学习用途&#xff0c;请遵守《网络安全法》. 二、安装iis服务软件 &#xff08;一&#xff09;查看Internet…

重生奇迹MU 单挑团战全能的职业

若你正在寻找一款能够在重生奇迹MU单挑或团战中表现不怂的职业&#xff0c;那么恭喜你&#xff0c;你来到了正确的地方。在本文中&#xff0c;我们将为你介绍几个在重生奇迹MU中表现出色的职业&#xff0c;并分享一些有用的技巧和策略&#xff0c;帮助你在游戏中获得胜利。不用…

【Linux】进程池实例

这篇博客讲解了进程池的创建过程&#xff0c;并在最后附上了完整代码。 现在有一个父进程&#xff0c;然后提前创建出一批子进程&#xff0c;未来如果父进程master有一些任务要交给子进程去运行&#xff0c;而不用像shell&#xff0c;需要执行命令才回去创建进程&#xff0c;创…

气膜建筑与装配式建筑的对比分析—轻空间

在现代建筑中&#xff0c;气膜建筑和装配式建筑都作为新型建筑形式受到关注。然而&#xff0c;在很多应用场景中&#xff0c;气膜建筑展现出了比装配式建筑更为明显的优势。以下将着重对比气膜建筑相较于装配式建筑的独特优势。 气膜建筑的突出优势 1. 更快的施工速度 气膜建筑…

信号量笔记

1、信号量简介 信号量是一种实现任务间通信的机制&#xff0c;可以实现任务之间同步或临界资源的互斥访问&#xff0c;常用于协助一组相互竞争的任务来访问临界资源。在多任务系统中&#xff0c;各任务之间需要同步或互斥实现临界资源的访问&#xff0c;信号量功能可以为用户提…

智能新时代:探索【人工智能】、【机器学习】与【深度学习】的前沿技术与应用

目录 1. 引言 1.1 人工智能的概念与历史 1.2 机器学习与深度学习的演进 1.3 计算机视觉的崛起与应用场景 2. 人工智能基础 2.1 什么是人工智能&#xff1f; 2.2 人工智能的分类 2.3 人工智能的现实应用 3. 机器学习 3.1 机器学习的定义与基本原理 3.2 机器学习的主要…

【可能是全网最丝滑的LangChain教程】二十二、LangChain进阶之Callbacks(完结篇)

这是LangChain进阶教程的最后一篇&#xff0c;Let’s get it!!! 01 Callback介绍 在LangChain中&#xff0c;Callback 是一种非常重要的机制&#xff0c;它允许用户监听和处理在执行链式任务 (Chain) 过程中的各种事件。这包括但不限于开始执行、结束执行、异常处理等。Callba…

数据结构(邓俊辉)学习笔记】串 03——KMP算法:记忆法

文章目录 1. 重复匹配的前缀2. 不变性3. 记忆力4. 预知力 1. 重复匹配的前缀 关于串匹配&#xff0c;包括蛮力算法在内&#xff0c;至少有30多种知名的算法&#xff0c;而接下来&#xff0c;就将介绍其中最为经典的 KMP 算法。这个算法之所以著名&#xff0c;不仅是由于它出自包…

Autosar(Davinci) --- ADT和IDT如何Mapping

前言 这里我们讲一下ADT如何与IDT进行Mapping 一、ADT为什么要与IDT进行Mapping 二、ADT和IDT如何Mapping 鼠标右键【type Mapping Sets】,选择【New Data type Mapping Set...】 打开之后,我们起一个名字【DemoTypeMapping】 然后选择【Data Type Maps】来将ADT与IDT进行m…