Z值相关技术概论理清
开始之前先简单理清科普一下涉及的跟三维图形学相关的深度Z相关的概念:
- Z-Buffer:上个世纪八十年代的图形学飞跃节点算法之一; Z缓冲是一种解决深度排序问题的方法,主要用于确定哪些物体在其他物体的前面。每个物体的每一个像素点被赋予一个深度值(Z值),并且会被储存在Z-buffer中。渲染时,系统会检查新的像素的Z值是否小于已储存在Z-buffer中的Z值,如果小于,则更新Z-buffer的值,并且在屏幕上绘制该像素,否则不进行绘制(与Z-Test与Z-Write紧密联合使用)。这种技术基本上是为了避免进行不必要的像素绘制,从而优化性能。
- Early-Z,需要GPU底层支持的,其可以在进行像素着色之前就对像素进行深度测试。通过这种方式,如果有一个像素在早期就被判定为被遮挡,则可以跳过对这个像素的昂贵的着色计算,因此可以大大提升图形渲染的性能。
- Z-Cull,:Z-Culling也是一种3D场景优化技术,它在渲染管线阶段(应用程序阶段)尽早剔除那些肯定不可见的多边形,以避免无效的图形计算。GPU利用Z-buffer以确定哪些图元对最终图像不可见,然后丢弃它们以节省资源。
- Z-Test与Z-Write在图形管线(一)后处理阶段 alpha测试 模版测试 深度测试 混合
也就详细介绍,这里就不在赘余。 - Hierarchical Z-Buffer(分层Z缓冲区):硬件的场景优化技术,基本思想是先快速地清除视图中被完全遮挡的区域,这可以大幅度减少因不可见的像素而浪费的渲染时间。虽然存在Z-Test,但在许多情况下,有很大一部分的像素是完全被其他像素所遮挡的,理论上,这些被遮挡的像素是无需进行渲染的。Hierarchical Z-Buffer使用一种叫做四叉树(Quadtree)或者八叉树的数据结构,将屏幕分割为不同的区域。在四叉树中,每一个节点代表了一个屏幕区域,其子节点则代表了这个区域的四个子区域。当开始渲染时,首先对树的顶层节点进行深度测试。如果一个节点失败了深度测试,那么就可以保证这个节点所代表的整个屏幕区域都在其他物体的后面,因此无需再去处理这个节点下的任何子节点。这就跳过了大量的深度测试,大幅度提高了渲染性能。Hierarchical Z-Buffer是一种非常有效的硬件加速技术,很多现代的GPU都会内建支持这种技术。
- Z-Sort(Z排序):解决OIT的一种方法,顾名思义,这种方法是根据距离观察者的远近,对所有物体或者透明物体进行排序。尤其是在绘制透明对象时,Z排序尤其重要!因为你通常需要从后向前的顺序来正确地融合颜色。
- W-Buffering(W缓冲):这是一种类似于Z-buffer的技术,但是用摄像机空间中的w坐标(经过透视变换之后的z坐标)来代替z值。这种方法可以提供更精确的深度测试,特别是当你处理远离摄像机的几何体时。
- Depth Peeling: 这种技术用于渲染半透明物体,它通过多次渲染场景并逐渐“剥离”最前面的透明层,从而为每个像素生成一个由前到后的透明层列表(之前我写的博客中提到 透明的渲染
)。 - Stencil Buffer(模板缓冲):虽然不直接基于深度值,但模板缓冲经常与深度缓冲共同使用,用于为每个像素创建一个额外的信息层,这可以用来控制渲染操作的应用程度 图形管线(一)后处理阶段 alpha测试 模版测试 深度测试 混合
。
Z值在管线空间转换中的变化:
不同的空间变换对Z值(深度值)的处理方式有所不同,其中一部分是线性变化,另外一部分则是非线性变化。
- 模型空间、世界空间和视图空间:在这些空间里,Z值(深度)是线性变化的。这主要是因为这些空间的变换通常包含平移、旋转、缩放等线性运算。
- 裁剪空间和屏幕空间:在裁剪空间进行透视除法(除以齐次坐标W)后,深度Z值变成了非线性的。透视除法是将三维空间投影到二维屏幕上,同时保持透视感(远处对象小,近处对象大)。然而,这导致了Z值(深度)的非线性变化,即距离相机越近,Z值变化越大;距离相机越远,Z值变化越小。
单精度float精度问题:
除此之外我们还需要考虑其他的,单精度! 在现代的GPU架构内我们都是单精度float的至少在目前为止没有双精度double的。根据 IEEE二进制浮点数算术标准(ANSI/IEEE Std 754-1985) 的规定:一个float 四字节共32位,其中1个符号位,8个指数位,剩余的23 位有效位,这就导致了精度只能达到7 到8 位,甚至8到9位就无法表示了,在计算机中就是随机给。
相对应的flaot精度的分布图如下:
这说明浮点数的分布与深度值的分布一样是不均与的,越靠*0的浮点数分布越密集,越远离0的浮点数分布越稀疏浮点数的范围和精度问题(从原理到结论)
。
Reverse-z的简介
通常在三维场景中的深度值Z是如图
越靠近近平面深度值的精度越高,反正则越稀疏,当远场景中两个靠的较近的面由于精度等问题导致的深度值的比较相近,Z-test上一帧A大于B下一帧B大于A的深度就会导致Z-Fighting的产生。
对于"Reverse-Z"是它也是一种距离(深度)缓冲策略。 它的工作原理是将Z缓冲区的表示颠倒过来,使得0表示最远处,1表示最近处。使用反向Z缓冲,近处的值被设置为1,而远处的值被设置为0。这使得3D场景的远景中获得更高的精度,并有效地解决了Z-fighting等问题,同时还能更好地利用z-buffer精度,这在大型开放世界游戏和其他需要大规模深度范围的应用中尤其重要。另外,Reverse-z策略通常需要配合无穷远遮挡剔除(Infinite Far Plane Clipping)技术使用,以处理极远处的物体。
Reverse-z的本质一句话就是,在View Space下对应的平面尽量均匀分布,移动视野等过度相对平滑,使得不管近处或是远处的物体都极低概率出现z-fighting现象为佳。 传统的近平面映射至0,远平面至1的方法,因为Z值在NDC空间内与View Space 并非线性映射,再加上浮点数的精度在靠近0的范围聚集两点原因,导致高精度范围完全堆积在了靠近近平面的位置。
如下图虽然我们使用反向Z缓冲+正常的精度来表示深度的精度,近处的值被设置为1,而远处的值被设置为0但是跟之前Z的分布没有太大的区别!
但当我们将Reversed-Z([n,f]映射到[1,0])与浮点数结合起来,情况就变成了: 距离相机近和远的物体分得的深度值就比较均匀了,实现了改善深度值分布状况,从而也达到了降低Z-Fighting出现的概率(是的,虽然Reversed-Z这么神奇,但Z-Fighting还是不能完全避免的,虽然概率已经降到很低)。
为什么说Near与far 颠倒过来与float精度结合会有如此效果:这种颠倒是有原因的。主要的优势在如上单精度的表述在于浮点数的精度分布。浮点数在接近0的区间拥有更高的精度,允许更精细的深度分辨率。就是这样Near与far取反结合1、浮点数在接近0的区间拥有更高的精度,而且2、正常的通常深度值是近的深度精度越高,远的深度越远,两者结合互补的效果。当然这样做是要求修改投影矩阵的,所以要在一开始的时候就做好~~
opengl实现Reverse-z:
Reversed-Z 设计用于 [0,1] 范围内的剪辑空间 Z 值,而不是 [-1,+1] 范围内。 OpenGL 的默认约定是 [-1,+1],但您可以使用 glClipControl 覆盖它:但是可以通过修改剪裁范围为[0.0, 1.0],从而同样可以使用反向z。 底下有一篇文章有详细的做法:Reverse-z在OPENGL的实现
特别注意:
Reversed-Z除了将([n,f]映射到[1,0])修改投影矩阵以将深度值反向映射外,并且你还需要修改你的Z-Test函数。例如,如果你之前是用GL_LESS作为深度测试函数,则需要改为GL_GREATER。同时,确保清除深度缓冲时使用的值是0,而不再是1,因为理论上,最远的物体应该拥有最小的深度值。
参考资料:
- Reversed-Z详解
- Reversed-Z in OpenGL
- 精度优化–ReversedZ提高zbuffer精度
- 反向Z(Reversed-Z)的深度缓冲原理
- Depth Precision Visualized | NVIDIA Developer — 深度精度可视化 |英伟达开发者