蒙特卡洛积分、重要性采样、低差异序列

news2024/11/15 12:18:07

渲染公式

渲染的目标在于计算周围环境的光线有多少从表面像素点反射到相机视口中。要计算总的反射光L_{o}(v),每个入射方向的贡献l,必须将他们在半球上相加:

L_{O}(v) = \int_{\Omega }^{} L_{i}(l)f(l,v)cos\Theta dw

\Theta为入射光线 l 与法线 n 的夹角,为方便计算可以使用法线向量和入射向量(单位化)的乘积表示。

 对于基于图像的光照,入射光线可以由环境贴图近似,其中每个纹理像素对应一个入射方向l,并忽略遮挡。但是即使采用这种近似,图像中一个像素的光照数值积分对实时渲染而言还是过于昂贵。


蒙特卡洛积分

蒙特卡罗积分方法是一种计算方法。原理是通过大量随机样本,去了解一个系统,进而得到所要计算的值。它非常强大和灵活,又相当简单易懂,容易实现。对于许多问题来说,它往往是最简单的计算方法,也可能是唯一方法。积分公式近似计算如下:

为了求解这个积分,我们在 a到 b上采样 N 个随机样本,将它们加在一起并除以样本总数来取平均。其中f(x)为概率分布函数,pdf表示概率密度函数,它的含义是特定样本在整个样本集上的发生概率。

当涉及蒙特卡洛积分时,某些样本可能比其他样本具有更高的生成概率。这就是为什么对于任何一般的蒙特卡洛估计,我们都会根据 pdf 将采样值除以或乘以采样概率。到目前为止,我们每次需要估算积分的时候,生成的样本都是均匀分布的,概率完全相等。到目前为止,我们的估计是无偏的,这意味着随着样本数量的不断增加,我们最终将收敛到积分的精确解。

        但是,某些蒙特卡洛估算是有偏的,这意味着生成的样本并不是完全随机的,而是集中于特定的值或方向。这些有偏的蒙特卡洛估算具有更快的收敛速度,它们会以更快的速度收敛到精确解,但是由于其有偏性,可能永远不会收敛到精确解。通常来说,这是一个可以接受的折衷方案,尤其是在计算机图形学中。因为只要结果在视觉上可以接受,解决方案的精确性就不太重要。下文我们将会提到一种(有偏的)重要性采样,其生成的样本偏向特定的方向,在这种情况下,我们会将每个样本乘以或除以相应的 pdf 再求和。

        蒙特卡洛积分在计算机图形学中非常普遍,因为它是一种以高效的离散方式对连续的积分求近似而且非常直观的方法:对任何面积/体积进行采样——例如半球 Ω ——在该面积/体积内生成数量 NN 的随机采样,权衡每个样本对最终结果的贡献并求和。

        蒙特卡洛积分是一个庞大的数学主题,在此不再赘述,但有一点需要提到:生成随机样本的方法也多种多样。默认情况下,每次采样都是我们熟悉的完全(伪)随机,不过利用半随机序列的某些属性,我们可以生成虽然是随机样本但具有一些有趣性质的样本向量。例如,我们可以对一种名为低差异序列的东西进行蒙特卡洛积分,该序列生成的仍然是随机样本,但样本分布更均匀:

        当使用低差异序列生成蒙特卡洛样本向量时,该过程称为拟蒙特卡洛积分。拟蒙特卡洛方法具有更快的收敛速度,这使得它对于性能繁重的应用很有用。

        鉴于我们新获得的有关蒙特卡洛(Monte Carlo)和拟蒙特卡洛(Quasi-Monte Carlo)积分的知识,我们可以使用一个有趣的属性来获得更快的收敛速度,这就是重要性采样。我们在前文已经提到过它,但是在镜面反射的情况下,反射的光向量被限制在镜面波瓣中,波瓣的大小取决于表面的粗糙度。既然镜面波瓣外的任何(拟)随机生成的样本与镜面积分无关,因此将样本集中在镜面波瓣内生成是有意义的,但代价是蒙特卡洛估算会产生偏差。

        本质上来说,这就是重要性采样的核心:只在某些区域生成采样向量,该区域围绕微表面半向量,受粗糙度限制。通过将拟蒙特卡洛采样与低差异序列相结合,并使用重要性采样偏置样本向量的方法,我们可以获得很高的收敛速度。因为我们求解的速度更快,所以要达到足够的近似度,我们所需要的样本更少。因此,这套组合方法甚至可以允许图形应用程序实时求解镜面积分,虽然比预计算结果还是要慢得多。


重要性采样

 方差估算:

随着N的增长,方差线性降低。但是估算正比于标准差,标准差以 \sqrt{N}速度降低,这也是蒙特卡罗方法的一个问题,估算收敛到正确结果的速度比较慢。

通过方差计算公式可知,当f(x) /pdf(x)为常数时,方差为0,所以概率密度函数曲线形状越接近被积函数f(x) 方差越小,但是 很多时候我们并不知道f(x) 是什么样子的曲线。然而我们可以通过选择一个形状类似于f(x) 形状的pdf(x) 来实现减少方差。

 当我们使用有限的采样集时,生成均匀的随机方向并不是最佳方法。对于Specular IBL,我们对环境中的有光泽的材质进行积分,那么在高光反射(或者镜面反射)方向周围进行采样最为合理,这是因为大部分反射光都是由这个方向发出的。

通过使用概率密度函数pdf 来定义采样的最佳方向,函数峰值代表重要的采样区域,通过这种重要度采样可以减少方差,达到对积分的最佳近似。在接近高光反射方向,这种采样数需要较高的地方, pdf 值会变得较低,相当于提高了采样的数值(间接来说就是提升了次数),相反在采样数较低的地方, pdf 值会比较高,相当于间接减少采样次数 。



低差异序列

使用伪随机数产生随机采样会造成方向分布不均匀,因为伪随机数之间并不了解彼此的信息,可能会产生丛聚,这会导致蒙特卡罗积分方程式中,预估的准确性较差,收敛速度慢。通过使用低差异序列替换伪随机数,我们可以提高准确度,它本质上可以更好地保证分配的方向。使用Low-Discrepancy Sequence来生成蒙特卡罗采样向量,这个过程被称为Quasi-Monte Carlo积分。Quasi-Monte Carlo方法有更快的收敛速度,使他能够胜任大型复杂的应用。

当使用低差异序列生成蒙特卡洛样本向量时,该过程称为拟蒙特卡洛积分。拟蒙特卡洛方法具有更快的收敛速度,这使得它对于性能繁重的应用很有用。

我们将使用重要性采样来预计算间接反射方程的镜面反射部分,该采样基于拟蒙特卡洛方法给出了随机地低差异序列。我们将使用的序列称之为Hammersley序列。Hammersley序列是基于Van Der Corpus 序列,该序列是把十进制数字的二进制表示镜像翻转到小数点右边得到。

float RadicalInverse_VdC(uint bits) 
{
    bits = (bits << 16u) | (bits >> 16u);
    bits = ((bits & 0x55555555u) << 1u) | ((bits & 0xAAAAAAAAu) >> 1u);
    bits = ((bits & 0x33333333u) << 2u) | ((bits & 0xCCCCCCCCu) >> 2u);
    bits = ((bits & 0x0F0F0F0Fu) << 4u) | ((bits & 0xF0F0F0F0u) >> 4u);
    bits = ((bits & 0x00FF00FFu) << 8u) | ((bits & 0xFF00FF00u) >> 8u);
    return float(bits) * 2.3283064365386963e-10; // / 0x100000000
}
// ----------------------------------------------------------------------------
vec2 Hammersley(uint i, uint N)
{
    return vec2(float(i)/float(N), RadicalInverse_VdC(i));
}  

GLSL 的 Hammersley 函数可以获取大小为 N 的样本集中的低差异样本 i。

无需位运算的 Hammersley 序列

并非所有 OpenGL 相关驱动程序都支持位运算符(例如WebGL和OpenGL ES 2.0),在这种情况下,你可能需要不依赖位运算符的替代版本 Van Der Corpus序列:

float VanDerCorpus(uint n, uint base)
{
    float invBase = 1.0 / float(base);
    float denom   = 1.0;
    float result  = 0.0;

    for(uint i = 0u; i < 32u; ++i)
    {
        if(n > 0u)
        {
            denom   = mod(float(n), 2.0);
            result += denom * invBase;
            invBase = invBase / 2.0;
            n       = uint(float(n) / 2.0);
        }
    }

    return result;
}
// ----------------------------------------------------------------------------
vec2 HammersleyNoBitOps(uint i, uint N)
{
    return vec2(float(i)/float(N), VanDerCorpus(i, 2u));
}

请注意,由于旧硬件中的 GLSL 循环限制,该序列循环遍历了所有可能的 32 位,性能略差。但是如果你没有位运算符可用的话可以考虑它,它可以在所有硬件上运行。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/132927.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Linux|科普扫盲帖|配置网络软件源---阿里云镜像仓库服务使用(centos,Ubuntu)

前言&#xff1a; 部署搭建各种环境&#xff0c;例如&#xff0c;集群环境&#xff0c;编译环境&#xff0c;测试环境&#xff0c;桌面环境&#xff0c;lnmp环境等等以及修复各种各样的漏洞&#xff0c;基本是使用本地仓库就可以完成的&#xff0c;但本地仓库有一个比较致命的…

深入理解TDNN(Time Delay Neural Network)——兼谈x-vector网络结构

概述 TDNN&#xff08;Time Delay Neural Network&#xff0c;时延神经网络&#xff09;是用于处理序列数据的&#xff0c;比如&#xff1a;一段语音、一段文本将TDNN和统计池化&#xff08;Statistics Pooling&#xff09;结合起来&#xff0c;正如x-vector的网络结构&#x…

x86_64架构的VINS-fusion-GPU部署

x86_64架构的VINS-fusion-GPU部署 1. 环境配置&#xff08;Ubuntu 18.04&#xff09; &#xff08;0&#xff09;CUDA 10.2 安装 由于笔记本的GPU太老&#xff08;GeForce 840M&#xff09;&#xff0c;只能使用较低版本的 CUDA&#xff0c;但是也能有个好处就是能够同时兼顾…

Linux TCP 拥塞正反馈 bad case

前置知识&#xff0c;TCP thin stream&#xff0c;参见&#xff1a; 该文档中搜索 tcp_thin_linear_timeoutsTCP-thin-stream 看图说话&#xff1a; 参见 tcp_retransmit_timer 函数&#xff0c;着重看下面段落&#xff1a; if (sk->sk_state TCP_ESTABLISHED &&am…

视觉SLAM学习路线

导师让我了解SLAM&#xff0c;SLAM原本是比较小众的方向&#xff0c;最近自动驾驶火起来&#xff0c;做这个SLAM的人也多了&#xff0c;反过来也会推动机器人感知的发展。希望未来学成的时候&#xff0c;能赶上机器人大规模普及&#xff0c;就业一片蓝海。学SLAM方向跟motion p…

RabbitMQ延迟列队的使用

目录 1. 延迟队列使用场景 2. RabbitMQ中的延迟队列实现思路 3. 实现示例 3。运行项目测试 1. 延迟队列使用场景 延迟队列一般可用于具有时间限制的任务&#xff0c;例如&#xff1a;限时优惠&#xff0c;超时的订单处理等。 对于这种场景&#xff0c;传统的处理方式是任…

Ceph: ceph基础知识

ceph基础知识 一、基础概念 ceph官方文档 http://docs.ceph.org.cn/ ceph中文开源社区 http://ceph.org.cn/ 1、概述 Ceph是可靠的、可扩展的、统一的、开源分布式的存储系统。 Ceph是一个统一的分布式存储系统&#xff0c;设计初衷是提供较好的性能、可靠性和可扩展性。 C…

Python基础知识(一)

目录 输入输出函数 输入函数&#xff1a;input() 输出函数&#xff1a;print() 算术运算符 关系运算符 逻辑运算符 变量 1.命名规则 2.变量类型 3.动态类型特性 输入输出函数 输入函数&#xff1a;input() name input("请输入&#xff1a;") print(nam…

第二证券|北向资金全年净买入约900亿元 哪些行业和个股成“香饽饽”

2022年A股收官。回顾这一年&#xff0c;面临复杂严峻的国内外环境&#xff0c;A股商场推动完善多元融资支撑机制&#xff0c;加大了对实体经济的金融支撑力度&#xff0c;为中国经济V形复苏做出了奉献。这一年&#xff0c;A股IPO融资规划创出历史新高&#xff0c;存量上市公司打…

驱动的并发和竞争

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 文章目录前言一、什么是并发&#xff1f;并发并行并发并行模式二、什么是竞争三、如何解决竞争1、原子操作整形原子操作&#xff1a;原子位操作2.自旋锁3.信号量4.互斥锁5.如…

mysql批量更新方法

mysql批量更新方法 实验mysql版本为5.7.20 隔离级别为rr&#xff0c;加锁场景的问题在mysql8.0.18中为复现 方法一 replace into 批量更新 原理&#xff1a;replace into table (col1,col2) values (x1,x2), 操作本质是对重复的记录先delete 后insert 缺点&#xff1a;1、如…

特斯拉Model S及Model X 2023上半年交付,1月6日公布售价

特斯拉Model S及Model X终于快要交付了。 2022年12月30日&#xff0c;广州国际车展盛大开幕。众多车企带来了旗舰车型&#xff0c;让观众直呼太过瘾&#xff0c;其中&#xff0c;人流量爆火的莫过于特斯拉展台。此次&#xff0c;特斯拉携旗下S3XY家族重磅出击&#xff0c;全新车…

【C++基础】08:模板

模板 OVERVIEW模板一、函数模板1.func template基本使用&#xff1a;2.func template案例&#xff1a;数组排序3.函数与函数模板的区别&调用规则&#xff1a;4.func template的局限性&#xff1a;二、类模板1.类模板基本使用&#xff1a;2.类模板与函数模板的区别&#xff…

AOA估计中的MUSIC算法(Matlab代码实现)

目录 &#x1f4a5;1 概述 &#x1f4da;2 运行结果 &#x1f389;3 参考文献 &#x1f468;‍&#x1f4bb;4 Matlab代码 &#x1f4a5;1 概述 随着阵列信号处理技术的不断发展,到达角估计(Angle Of Arrival)的研究在移动通信系统中具有重要意义。通过分析经典MUSIC算法,…

golang 自定义命令行flag包简单使用

一、为什么需要使用golang自定义命令行 不恰当的比喻&#xff0c;当我们写了一个服务代码后&#xff0c;按照简单的思维&#xff0c;我们会在业务代码中将要连接的数据库 用户名、主机名、端口号、密码写死。 那么也就意味着我们启动该服务后都只能固定连接某一个数据库&#x…

etcd快速入门

etcd是什么 etcd是CoreOS团队于2013年6月发起的开源项目&#xff0c;它的目标是构建一个高可用的分布式键值(key-value)数据库。 etcd内部采用raft协议作为一致性算法&#xff0c;etcd基于Go语言实现。 etcd作为服务发现系统&#xff0c;有以下的特点&#xff1a; 1.简单&#…

分享67个PHP源码,总有一款适合您

链接&#xff1a;https://pan.baidu.com/s/1MzKN0bLDRv0i290R2erMHQ?pwdbo2i 提取码&#xff1a;bo2i PHP源码 分享67个PHP源码&#xff0c;总有一款适合您 下面是文件的名字&#xff0c;我放了一些图片&#xff0c;文章里不是所有的图主要是放不下...&#xff0c;大家下载…

寒假每日一题W1D3——上课睡觉

题目描述 有 N 堆石子&#xff0c;每堆的石子数量分别为 a1,a2,…,aN。 你可以对石子堆进行合并操作&#xff0c;将两个相邻的石子堆合并为一个石子堆&#xff0c;例如&#xff0c;如果 a[1,2,3,4,5]&#xff0c;合并第 2,3 堆石子&#xff0c;则石子堆集合变为 a[1,5,4,5]。…

【学习】backdoor attacks、Adversarial Attack on Images、Adversarial Attack on Audio

文章目录一、后门攻击backdoor attacks1、data poisoning2、backdoored PLM3、defenseONION4、后门攻击:绕过ONION防御5、摘要二、Adversarial Attack on Imagesone pixel attackdifferential evolution三、Adversarial Attack on Audio一、后门攻击backdoor attacks 什么是后…

进程的终止和等待

目录 进程终止 如何获取退出码呢&#xff1f; 进程退出方法有哪些&#xff1f; 对于进程退出&#xff0c;内核OS做了什么&#xff1f; 进程等待 为什么要进行进程等待&#xff1f; 如何进行进程等待&#xff1f; 什么是阻塞和非阻塞等待&#xff1f; 进程终止 对于进程…