MipNeRF:多尺度、抗混叠NeRF

news2025/1/11 3:58:23

Mip-NeRF: A Multiscale Representation for Anti-Aliasing Neural Radiance Fields

​ ICCV 2021

文章目录

  • Mip-NeRF: A Multiscale Representation for Anti-Aliasing Neural Radiance Fields
    • 原始NeRF的问题
    • 重点components
      • Cone Tracing
      • IPE-integrated positional encoding
    • PE与IPE的差异
    • 训练数据的结构

原始NeRF的问题

在这里插入图片描述

  1. (a, top) 用full-resolution训练的NeRF能够渲染photo-realistic view,但仅仅是渲染与训练图像相同的scale或resolution时;
  2. (a, bottom) 减小图像分辨率(后拉camera并zooming in或相似的操作。smartphone:人往后退,用双指将屏幕中的图像放大)会导致renderings出现严重的锯齿;注:此处应该是指在full-resolution的NeRF模型上渲染低分辨率图像会导致严重的锯齿,而不是指训练数据用低分辨率;
  3. (b) 在multi-resolution images上训练NeRF稍微改善了这个问题,但会导致跨尺度的渲染质量差:全分辨率时模糊,低分辨率时“锯齿”。
  4. c) MipNeRF也是在multi-resolution images上进行训练,但跨尺度渲染的效果不错。

原因:
在这里插入图片描述
NeRF沿着pixel对应的ray提取point-sampled positional encoding features,这些point-sampled features:

  1. 忽略了ray看到的volume的形状和大小(图中的蓝色和黄色截头圆锥。右边的camera更近,其看到的scene volume如蓝色所示,较小的截头圆锥;而左边的camera更远,看到的应该比右边的要大,如黄色部分所示);
  2. 导致两个不同的camera以不同的scale(可理解为与scene距离不相等的两个camera)对相同的位置(如图中红点)进行成像时可能会提取相同的point-sampled feature(按道理feature应该不一样),从而降低NeRF的性能。

NeRF的Ray Tracing存在ambiguity:不同位置camera对相同空间点提取了相同的point-sampled feature,即无辨识度。

而MipNeRF通过Cone Tracing解决这种ambiguity,如下图所示。因为不同位置camera所cast的cone是不一样大小的,所以对空间同一点所产生的feature不一样(如何产生feature见后文IPE),有辨识度。
在这里插入图片描述
从信号处理的角度解决锯齿/混叠问题:一是增加采样频率(增加采样点数量,每个pixel 用多条rays);二是预滤波,用low-pass filter减小所需的Nyquist频率,这样所需的采样点数量减少(本文属于方式二)。

重点components

Cone Tracing

pixel所cast的不是ray,而是cone,可消除NeRF的ambiguity。

IPE-integrated positional encoding

IPE(integrated positional encoding):MipNeRF将cone划分为N段,即N个截头圆锥,如何获取这些截头圆锥的feature呢?一个直接的方法就是用NeRF中所用的积分方式,公式如下:
在这里插入图片描述
其中 F ( ∗ ) F(*) F()表示某个截头圆锥, γ ( X ) \gamma(X) γ(X)就是截头圆锥某点的positional encoding特征(就是NeRF中的PE)。但是 F ( ∗ ) F(*) F()的分布是未知的,所以上式无法计算。本文用多元高斯函数来近似一个截头圆锥,从而能够计算上式。

如何用多元高斯函数近似一个截头圆锥?具体推导见论文及论文附录。

PE与IPE的差异

NeRF的PE公式:
γ ( x ) = [ s i n ( x ) , c o s ( x ) , . . . , s i n ( 2 L − 1 x ) , c o s ( 2 L − 1 x ) ] \Large \gamma(x) = [sin(x), cos(x), ..., sin(2^{L-1}x),cos(2^{L-1}x)] γ(x)=[sin(x),cos(x),...,sin(2L1x),cos(2L1x)]
MipNeRF的IPE公式:
在这里插入图片描述
和NeRF中的PE相比,多了一个指数衰减项,且空间位置X变成了 μ γ \mu_{\gamma} μγ,即截头圆锥均值的PE,是一个统计值。
在这里插入图片描述

参考链接-IPE的特点。一个截头圆锥的统计属性(均值、方差)和它所处的位置相关,意味着IPE特征是用截头圆锥的位置计算的,和PE的本质一样,只不过IPE用的是位置的统计属性。上图中蓝色表示高频、红色表示低频。对于高频部分变化较快,有很多细条(右图中的①);低频部分变化较慢(右图中的②),是宽条。IPE对这些频率进行积分,如果截头圆锥比较大,则最终积分结果中高频趋于0;如果截头圆锥比较小,则高低频都有(此时等价于PE)。

训练数据的结构

用源代码中dataset.py文件进行分析。将synthetic data缩放为不同等级,如800x800, 400x400, 200x200, 100x100的大小,总计400张。代码文件dataset.py中的MultiCamera类即是所使用的多尺度训练数据,其有两个比较重要的成员:self.images, self.rays,前者是图片数据,类型是list,大小为400,每个成员是一张图片,图片大小为上面4种情况;
在这里插入图片描述

后者是一个类似于字典的“类”,包括:directions, far等字段,它们均是list类型,长度均为400(与400张图片相对应)。如viewdirs成员变量,其第一个元素是(800,800,3),表示了(x,y)像素处的view direction(3D空间)。疑问:directions和viewdirs有什么不同?
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/94895.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

微服务框架 SpringCloud微服务架构 多级缓存 47 Lua 语法入门 47.2 变量和循环

微服务框架 【SpringCloudRabbitMQDockerRedis搜索分布式,系统详解springcloud微服务技术栈课程|黑马程序员Java微服务】 多级缓存 文章目录微服务框架多级缓存47 Lua 语法入门47.2 变量和循环47.2.1 数据类型47.2.2 变量47.2.3 循环47 Lua 语法入门 47.2 变量和…

人脸识别Face Recognition综述

综述:https://arxiv.org/pdf/2009.13290.pdf 人脸识别整个系统一般由三个关键要素构成:人脸检测(face detection)、人脸预处理(face preprocess),人脸表征(face representation&…

EtherCAT设备协议详解一、EtherCAT概述

EtherCAT简介: • 用于控制自动化技术的以太网(EtherCAT) 是一种基于以太网的现场总线系统 – 由倍福自动化™于2003年发明 – Beckhoff 创建了 EtherCAT 技术集团(ETG)于2004年推广议定书 –…

DBCO 点击化学:DBCO-PEG-COOH,DBCO-PEG-acid,羧基聚乙二醇环辛炔

一、产品描述: 西安凯新生物科技有限公司供应的:​DBCO-PEG-COOH,末端羧酸在活化剂(如EDC或HATU)存在下可与伯胺基反应,形成稳定的酰胺键。DBCO 点击化学可以在水性缓冲液中运行,也可以在有机溶…

来啦|深度讲解风控模型中的参数调优

大数据时代的风控体系必有模型部分的参与,用策略贯穿整个风控体系,以数据为驱动,模型一定是标配内容。于是在模型的建设上,如何精细化地输出一套有效的模型,就是在精细化管理上非常重要的一个差异点。不管传统的逻辑回…

MATLAB处理语音信号基本函数、模块

目录 一、sound函数 二、symerr函数用来计算错误码元数目和误码率 三、From Workspace 模块 四、To Workspace模块 一、sound函数 sound函数可以用来播放音频数据,将矩阵变为立体声播放。 二、symerr函数用来计算错误码元数目和误码率 三、From Workspace 模…

【High 翻天】Higer-order Networks with Battiston Federico (2)

目录测量矩阵表示中心化测度度(degree)路径(path)特征向量中心三元闭包和聚类系数单纯同调高阶Lapalacian算子超图拉普拉斯组合拉普拉斯接上回说到了高阶的表示方法,接下来开始高阶系统的测量方法。 测量 具体来说就…

逻辑越权总结(超详细总结涉及各类越权)

逻辑越权总结(超详细总结涉及各类越权)1.逻辑越权1.1.漏洞原理1.2.漏洞原因1.3.水平越权1.3.1.原理1.3.2.漏洞出现位置1.3.3.危害1.3.4.案例1.3.4.1.登录账号1.3.4.2.获取信息1.3.4.3.修改信息1.4.垂直越权1.4.1.原理1.4.2.漏洞出现位置1.4.3.条件1.4.4.…

艾美捷CpG ODN——ODN 1585说明书

艾美捷CpG ODN系列——ODN 1585:CpG寡脱氧核苷酸(A型)优化用于NK细胞活化,具有混合的磷酸二酯酶/硫代磷酸酯主链。小鼠TLR9(Toll样受体9)的特异性配体。 艾美捷CpG ODN 丨ODN 1585化学性质: 序…

kruskalCase克鲁斯卡尔算法

介绍 它的特点和Prim算法不一样,Prim是以点为主,通过顶点遍历没有访问的节点计算最小权重直至一条最小边出来;而Kruskal算法是以边为主,时间复杂度要低一些0(edge); 什么是最小生成树 最小生成树:在一个有n个结点的…

blender教程

文章目录Three的部分课件blender相关资源模型下载地址视图基本操作实现甜甜圈下落的动画day01笔记Three的部分课件 blender相关资源 模型下载地址 视图基本操作 shiftd 复制多个 g键移动 x y z锁定方向 A可以全选 然后选择大小 s 键 拖拽大小 ctrl a 全部应用 切换到不同的编…

Python 图表利器 pyecharts

随着互联网的高速发展,数据量也在疯狂增长,近几年数据分析,数据挖掘的岗位越来越吃香。说到数据分析,就离不开数据的可视化,毕竟图表比冷冰冰的数字直观,一眼就可以看出趋势和结论,毕竟一图胜千…

【AIOT】BLE Paper Relative

Billah, Md Fazlay Rabbi Masum, et al. “BLE Can See: A Reinforcement Learning Approach for RF-based Indoor Occupancy Detection.” Proceedings of the 20th International Conference on Information Processing in Sensor Networks (co-located with CPS-IoT Week 20…

对象池模式

一、对象池模式 1、定义 对象池模式(Object Pool Pattern)是将对象预先创建并初始化后放入对象池中,对象提供者就能利用已有的对象来处理请求,减少频繁创建对象锁占用的内存空间和初始化时间。属于创建型设计模式。 一个对象池包…

python 模板注入

web 程序包括两个文件: flask-test.py 和 Config.py 文件 #!/usr/bin/env python # -*- coding:utf8 -*- import hashlib import logging from datetime import timedelta from flask import Flask from flask import request from flask import config from flask…

基于java(springboot)篮球竞赛预约管理系统(java毕业设计)

基于java(springboot)篮球竞赛预约管理系统 篮球竞赛管理系统是基于java编程语言,mysql数据库,springboot框架和idea工具开发,本系统分为用户和管理员两个角色,其中用户可以在线注册登陆,查看平台公告,查看…

JSP运动会信息网站

开发工具(eclipse/idea/vscode等): 数据库(sqlite/mysql/sqlserver等): 功能模块(请用文字描述,至少200字): 模块划分:通知类型、通知信息、裁判信息、运动员信息、项目类型、项目 信息、场地信息、项目安排、报名信息…

【记录】ubuntu20.04安装nvidia显卡驱动

新安装的Ubuntu20.04系统,如果想进行人工智能相关的学习,需要配置一系列的环境,这里我记录下具体的安装过程。 Nvidia显卡驱动的安装 1 安装前需要安装依赖(必须执行) sudo apt-get update #更新软件列表 #安装编译依赖 sudo apt-get inst…

Python urllib CRLF注入漏洞小结

Python urllib CRLF注入漏洞小结 CVE-2016-5699 https://www.suse.com/security/cve/CVE-2016-5699.html before 2.7.10 and 3.x before 3.4.4POC: http://127.0.0.1%0d%0aX-injected:%20header%0d%0ax-leftover:%20:12345/foo漏洞&patch源码:http…

音视频大合集最终篇;学废了

前言 加企鹅群:1079654574 解锁 《音视频八大板块资料》音视频大合集,从初中高到面试应有尽有;让学习更贴近未来实战。已形成PDF版 八个模块内容如下: 1.音视频基础2.FFmpeg实战3.流媒体客户端4.流媒体服务器5.WebRTC项目实战6.Android NDK开…