VolSDF

news2024/11/15 11:30:56

Volume Rendering of Neural Implicit Surfaces(VolSDF):神经隐式曲面的体渲染


摘要:一个神经隐式表面体积渲染框架,将体积密度建模为几何形状的函数来实现表面重建。定义的体积密度函数作为拉普拉斯的累积分布函数(CDF)应用到一个有符号的距离函数(SDF)表示。优点:1、它向在神经体绘制过程中学习的几何结构提供有用的归纳偏置。2、它有助于不透明度近似误差的界限,导致对观察光线的准确采样。3、它允许在体积绘制中有效的无监督地解除形状和外观的纠缠。

1、介绍

将密度表示为到场景表面的有符号距离的函数,首先,它保证了生成密度的明确定义的表面的存在。其次,这种密度公式允许限制沿着光线的不透明度的近似误差。NeRF,将神经隐式函数与体积渲染相结合,能够达到极佳的渲染效果。然而在场景几何体形状的表示上有所欠缺。

2、方法

利用一种新的参数化的体密度,定义为变换的SDF,可以促进体渲染过程,并且文章推导出一个边界的不透明度近似的错误,设计了一个采样过程近似的体渲染积分(公式)。

2.1密度转换为SDF

Ω ⊂ R 3 \Omega\subset\mathbb{R}^3 ΩR3表示三维空间中物体占据的空间。使用 M = ∂ Ω \mathcal{M}=\partial\Omega M=Ω表示该物体的边界曲面。用1表示表示Ω指示函数,用d表示到其边界M的符号距离函数(SDF)在物体内部则用负数表示距离,在物体外部用正数表示距离。
在这里插入图片描述
使用可学习的符号距离函数d的变换来建模密度这一性质。α、β > 0是可学习参数,并且Ψβ是具有零均值和β尺度参数的拉普拉斯分布的累积分布函数(CDF)
在这里插入图片描述
拉普拉斯分布
在这里插入图片描述
直观地,密度σ对具有恒定密度α的均匀对象进行建模,该恒定密度α在对象的边界附近平滑地减小,其中平滑量由β控制。
将体积密度函数转换为SDF有两个好处。首先,它为表面几何提供了有用的归纳偏差,并为重建表面提供了一种原则性方法。这与以前的工作形成鲜明对比,即重建被选为学习密度的任意级别集。其次,有助于约束渲染体积的不透明度误差,这是体积渲染管线中的关键组成部分。这与以前的方法再次相反,在以前的方法中,很难为一般的MLP密度设计这样的边界。

2.2 σ的体渲染

首先回顾体渲染中的积分,每条射线有一组S个采样点, 在体渲染中,考虑从相机位置c∈R3 沿方向v∈R3 发出的射线x:x(t)= c + tv,t ≥ 0。体积渲染是所有关于近似于沿着这一射线到达相机的集成光辐射。其中有两个重要的参数:透明度T和光场L
透明度T定义如下公式,表示一个光粒子成功穿过段[c, x(t)]而不反弹的概率
在这里插入图片描述
不透明度O是互补概率O(t) = 1 −T(t),O是单调递增函数,O(0)=0,假设每条射线最终被遮挡即O(∞)=1,所以可以将O看作是拉普拉斯累积分布函数(CDF),即
在这里插入图片描述
从而得到概率密度函数(Probability Density Function, PDF)
在这里插入图片描述
L(x,n,v)是辐射场,即在方向v上从点x发出的光线,辐射场同样受到法线的影响 n ( t ) = ∇ x d Ω ( x ( t ) ) \boldsymbol{n}(t)=\nabla_{\boldsymbol{x}}d_\Omega(\boldsymbol{x}(t)) n(t)=xdΩ(x(t))
。使用法线是根据BRDF计算颜色中的法线。
解纠缠,接下来就是一系列的采样 S = { s i } i = 1 m , 0 = s 1 < s 2 < ⋯ < s m = M ; {\cal S}=\{s_{i}\}_{i=1}^{m},0=s_{1}<s_{2}<\cdots<s_{m}=M; S={si}i=1m,0=s1<s2<<sm=M; 累加估计这个积分(离散值),ti表示间距乘以PDF,Li表示采样的辐射场。
在这里插入图片描述
VolSDF的采样方案: 使用单个密度σ,并且通过基于不透明度近似的误差界的采样算法来计算采样S。

2.3 不透明度近似误差的界限

使用矩形规则开发不透明度近似误差的界限,对于一组样本 T = { t i } i = 1 n , 0 = t 1 < t 2 < ⋯ < t n = M \mathcal{T}=\{t_i\}_{i=1}^n,0=t_1<t_2<\cdots<t_n=M T={ti}i=1n,0=t1<t2<<tn=M,令 δ i = t t + 1 − t i \delta_{i}=t_{t+1}-t_{i} δi=tt+1ti σ i = σ ( x ( t i ) ) \sigma_i=\sigma(\boldsymbol{x}(t_i)) σi=σ(x(ti)),给定某个t ∈(0,M],假设t ∈ [tk,tk+1],并应用矩形规则(即,左黎曼和)以得到近似:
在这里插入图片描述
并且E(t)表示该近似中的误差。不透明度函数(等式5)的对应近似为,可以得到计算不透明度的近似公式 O ^ ( t ) = 1 − exp ⁡ ( − R ^ ( t ) ) \widehat{O}(t)=1-\exp(-\widehat{R}(t)) O (t)=1exp(R (t))
目标是导出[0,M]上近似为 O ^ ≈ O . \widehat{O}\approx O. O O.的一致界,关键是沿着射线x(t)的区间内密度o的导数的下界
Theorem 1.
密度σ在[ti,ti+1]段内的导数满足
在这里插入图片描述
在这里插入图片描述
该定理的好处是它允许仅基于区间端点处的无符号距离|di|,|di+1|和密度参数α,β来约束每个区间[ti,ti−1]中的密度导数。此界限可用于导出矩形规则的不透明度近似值的误差界限
在这里插入图片描述

Theorem 2
对于t ∈ [0,M],近似不透明度O的误差可以有界如下:
在这里插入图片描述
可以通过注意 E ^ ( t ) \widehat{E}(t) E (t),以及exp( E ^ ( t ) \widehat{E}(t) E (t))在t中单调递增,而exp(− R ^ ( t ) \widehat{R}(t) R (t))在t中单调递减,来约束t∈[tk,tk+1]的不透明度误差限制t ∈ [tk,tk+1]的不透明度误差,通过
在这里插入图片描述
取所有区间上的最大值提供了作为T和β的函数的界BT,β
在这里插入图片描述

Lemma 1

固定β > 0。对于任何 ϵ \epsilon ϵ> 0,足够密集的采样T将使得BT,β < ϵ \epsilon ϵ

其次,对于固定数量的样本,我们可以设置β,使得误差界低于 ϵ \epsilon ϵ

Lemma 2
固定n > 0。对于任何 ϵ \epsilon ϵ> 0,一个足够大的β满足
在这里插入图片描述
将保证BT,β ϵ \epsilon ϵ

这部分主要对不透明做了一个约束,让他的误差足够小。

2.4 采样算法

需要一些算法采样确定一组采样点使得近似结果与实际结果足够接近,即保证BT,β ϵ \epsilon ϵ
对于lemma1,选择足够大的采样点是可以保证误差足够小,但是采样点会很大,主要是用lemma2的方法,选择一个β+ >β,使得BT,β+ ϵ \epsilon ϵ,在保证该前提的情况下不断增加采样数,同时减小β+,这样的策略不保证收敛,然而实践表明有85%的概率可以收敛,即使不收敛也会保证小于误差
在这里插入图片描述
使用逆变换采样(11行)返回一组新的m = 64个样本(O)

2.5 损失计算

系统的输入是一系列图片以及对应的相机参数,模型对每一个具体的像素点p进行处理学习。每一个像素点p对应一个三元组 ( I p , c p , v p ) (I_{p},\boldsymbol{c}_{p},\boldsymbol{v}_{p}) (Ip,cp,vp), I p I_{p} Ip代表RGB颜色, c p \boldsymbol{c}_{p} cp为相机位置, v p \boldsymbol{v}_{p} vp为射线方向,损失函数由两部分组成
在这里插入图片描述
在这里插入图片描述

总结

VolSDF将体积密度表示为可学习的表面几何形状的符号距离函数的变换版本,提供了有用的归纳偏置,允许几何结构的解纠缠(密度)和辐射场,并且相对于先前的神经体绘制技术改进了几何近似。此外,它允许限制不透明度近似误差,从而导致体绘制积分的高保真度采样。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/510213.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

git 解决 “fatal: Could not read from remote repository.“

现象 在使用Git将本地仓库推送到远程仓库的时候&#xff0c;发生了如下错误&#xff1a;“fatal: Could not read from remote repository.” 原因 出现这错误一般是以下两种原因&#xff1a; 客户端与服务端未生成 ssh key客户端与服务端的ssh key不匹配 为解决以上问题&a…

斯坦福2023【FrugalGPT】减少大模型的商业化应用成本

文章目录 主要解决问题采用什么方法Prompt adaptationLLM approximationLLM cascade 实验结论讨论与展望 FrugalGPT: How to Use Large Language Models While Reducing Cost and Improving Performance 主要解决问题 这篇文章主要是要解决如何降低调用大语言模型的成本(Chat…

NMOS双向转换电路实测以及上升沿尖峰处理

NMOS双向转换电路实测以及上升沿尖峰处理 NMOS双向转换电路 &#x1f527;采用的是5V供电的STC8H单片机输出PWM波形&#xff0c;经过上面的电平转换电路测量低压端的波形。 ✨在做3.3V <>5V 电平转换电路方案验证时&#xff0c;输入5V PWM波形和输出波形的波形上升沿有尖…

[Java基础练习-002]综合应用(基础进阶),如果你会做,那说明你java入门了,

本篇的练习是一个综合性的练习&#xff0c;结合了各个知识点&#xff0c;比如选择结构、循环结构、数组等java基础知识。综合性运用比较强。 目录 1、进阶练习一、学习网站&#xff08;主要考察选择结构、输入语句&#xff09; 2、进阶练习二&#xff08;选择结构、循环&#…

SELinux详解

文章目录 SELinux详解什么是SELinux当初设计的目标&#xff1a;避免资源的误用传统的文件权限与账号主要的关系&#xff1a;自主访问控制(DOC)以策略规则制定特定进程读取特定文件&#xff1a;强制访问控制(MAC) SELinux的运行模式安全上下文进程与文件SELinux类型字段的相关性…

QQ邮箱 网易邮箱及企业邮箱开通SMTP/POP3及设置授权码

一 、什么是 POP3/IMAP/SMTP 服务 POP3 &#xff08;Post Office Protocol - Version 3&#xff09;协议用于支持使用电子邮件客户端获取并删除在服务器上的电子邮件。 IMAP &#xff08;Internet Message Access Protocol&#xff09;协议用于支持使用电子邮件客户端交互式存…

Windows Nvm+Node.js安装

前言 在windows系统下安装的是nvm-windows&#xff0c;nvm只支持安装在在Linux和Mac系统下。之前在Linux上安装过&#xff0c;最近在Windows上安装&#xff0c;特记录一下。 下载 下载地址&#xff1a;传送门 安装Nvm 双击exe文件&#xff0c;选定安装路径&#xff0c;下…

最新|事件相机SLAM综述

Arxiv链接:https://arxiv.org/abs/2304.09793 Github 链接:https://github.com/kun150kun/ESLAM-survey 视觉SLAM (vSLAM)是指移动机器人通过相机感知外部世界并估计机器人的位姿和重建周围环境的三维地图。vSLAM在各种应用中扮演着不可或缺的角色,包括自动驾驶,机器人导航…

【华为云服务器使用ftp21端口进行连接】

[使用ftp21端口连接华为云linux服务器] 华为云服务器使用ftp21端口进行连接 说明: 我们在操作linux服务器时, 经常想可视化的操作文件, 单使用命令行操作不友好。本文旨在使用ftp工具可视化的连接华为云服务器 1.安装vsfftpd 1.1 检查vsfftpd是否已安装 执行以下命令可以看…

网安笔记04 公钥密码体制

公钥密码体制 公钥密码体制的基本概念 保密性&#xff1a;确保信息只被授权的人访问 认证&#xff1a;确认某实体/数据源的真实性 保密性需要考虑到 不可否认性数据完整性 保密系统要考虑 达到实际上不可破 接获密文、某些明文密文对&#xff0c;决定密钥或者明文是不可…

没计算机基础,就是评职称用的,软考中级哪个好考啊?

那必须把系统集成项目管理工程师安排上&#xff01; 题目也不难&#xff0c;主要弄清楚47个过程的输入输出&#xff0c;还有工具的使用&#xff0c;几乎很多题都是按照这逻辑来的。 建议可以去网上、刷题APP上&#xff0c;多薅点资料和真题&#xff0c;集成是热门科目&#x…

Centos7.6华为云服务器安装FineBI

一、首先申请一个云端服务器 配置可根据自己需求申请,建议内存在16G以上 CPU 4核 内存 8GiB 系统盘 40GiB 带宽 1Mbit/s 二、在FineBI官网上查看安装方法,截图如下 下载后,直接根据上述步骤安装即可,一般不需要添加其余软件 在安装中遇到问题有以下几点 1.解压后,文件夹名…

一个网站引发的程序猿的牢骚,哈哈哈

2013年大学毕业后&#xff0c;参加工作做的第一个前端项目&#xff0c;北京服装学院&#xff0c;今天调研一个关于iframe的需求&#xff0c;突然想试试&#xff0c;以前那些做IE6兼容的项目是否还在使用&#xff0c;就默默的点开了。十年了&#xff0c;他们没有换网站&#xff…

Python中因为软拷贝导致调用face_recognition.encodings(img)出现的典型问题

问题描述 在使用face_recognition时&#xff0c;在对np.array格式图片使用形如new_img img[x:y, a:b]进行裁剪后&#xff0c;因为是软拷贝&#xff0c;导致前后图片其实引用了同一个face_locations, 从而导致莫名其妙的错误。 问题代码 检测一张照片里的人脸&#xff0c;并…

深度解耦:使用Jetpack新技术Hilt实现依赖注入

注入解耦是一种软件设计模式&#xff0c;旨在将应用程序的不同组件解耦。通过采用依赖注入、控制反转、面向接口编程等技术&#xff0c;注入解耦模式可以帮助开发人员将应用程序分解为可重用和可扩展的组件。这样做可以减少代码的耦合度&#xff0c;提高模块化和可测试性&#…

Java并发编程实践学习笔记(三)——共享对象之发布和异常

目录 1 公共静态变量逸出 2 非私有方法逸出私有变量 3 this引用逸出 4 构造函数中的可覆盖方法调用逸出 发布&#xff08;publishing&#xff09;一个对象的意思是&#xff1a;使对象能够在当前作用域之外的代码中使用。例如&#xff0c;将一个指向该对象的引用保存到其他代…

奖品收到了

质量一流&#xff01;物流速度快&#xff01;下次继续努力&#xff01; 开心

抽象、封装、继承、多态

抽象 抽象是从众多的事物中抽取出共同的、本质性的特征&#xff0c;而舍弃其非本质的特征的过程。 下面是抽象到封装的过程 如果不考虑实际的情况下 人的定义&#xff1a;有嘴、有脚、有眼睛、有耳朵、会吃饭、会跑。 动物的定义&#xff1a;有嘴、有脚、有眼睛、有耳朵、会…

2023年网红经济研究报告

第一章 行业概况 随着社交媒体和移动互联网的普及&#xff0c;网红经济迅速崛起。网红经济&#xff0c;是指以网络为平台&#xff0c;通过网红的影响力、热度和传播力&#xff0c;形成的一种以流量变现为主的商业模式。网红经济涉及到的行业非常广泛&#xff0c;如美妆、时尚、…

ai聊天机器人chatgpt收费版

AI聊天机器人的功能通常包括以下几个方面&#xff1a; 自然语言理解。该功能可以识别并理解用户输入的自然语言&#xff0c;如文本、语音等&#xff0c;以便进行后续的处理和回复。 对话管理。该功能可以管理对话的上下文和流程&#xff0c;并根据用户的输入和意图来产…