【UnityShader入门精要学习笔记】(1)了解渲染流水线

news2025/1/12 11:53:04

在这里插入图片描述
本系列为作者学习UnityShader入门精要而作的笔记,内容将包括:

  • 书本中句子照抄 + 个人批注
  • 项目源码
  • 一堆新手会犯的错误
  • 潜在的太监断更,有始无终

总之适用于同样开始学习Shader的同学们进行有取舍的参考。


文章目录

  • 渲染流水线
    • 什么是流水线
    • 什么是渲染流水线
      • 应用阶段
      • 几何阶段
      • 光栅化阶段
  • CPU和GPU的通信
    • 把数据加载到显存
    • 设置渲染状态
    • 调用Draw Call


渲染流水线

什么是流水线

什么是流水线?书中举了一个生产洋娃娃的例子。一个洋娃娃的生成过程可以被分为4个步骤:

1. 制作躯干
2. 缝上眼睛和嘴巴
3. 添加头发
4. 最终包装

洋娃娃的制作经过了四道工序,如果每道工序耗时一小时。而一个工人想要生产一个洋娃娃则需要四个小时。资本家们想到了一个好方法,让每个专人负责一道工序,这样四个人四道工序,所有步骤就可以同时并行。假设工序1完成了洋娃娃A的躯干制作任务,那么他不需要等待洋娃娃A被最终包装就能直接进行下一个洋娃娃B的躯干制作任务了。

熟悉编程的小伙伴可能更了解它的另一个名字,就是PipeLine。例如很多程序都会封装一条Pipeline来自动化调用整条流水线。
在这里插入图片描述

那么显然,一个洋娃娃生产所耗费的最大时间将由其中最耗时的工序来决定。在了解了流水线的概念之后,我们来看看什么是渲染流水线?

什么是渲染流水线

实际上,计算机的图像渲染也是流水线工作,它的任务是由一个3D场景出发,渲染成屏幕显示的2D图像。这个工作常常是由GPU和CPU共同完成的。

根据书中的介绍,我们将整个渲染流水线分为三个阶段,分别为:

  • 应用阶段(Application Stage)
  • 几何阶段(Geometry Stage)
  • 光栅化阶段(Rasterizer Stage)

在这里插入图片描述

其中每个阶段内部也包含了一些子流水线阶段。

应用阶段

这个阶段是由我们的应用主导的,并通常由CPU负责实现。我们开发者具有这个阶段的绝对控制权。

在这个阶段,我们需要做的工作有:

  • 首先准备好场景数据,包括摄像机,视锥体,场景中的模型和光源等等。
  • 然后为了提高渲染性能,我们需要进行粗粒度剔除(Culling) 的工作,剔除不需要渲染的物体。
  • 最后,我们还需要设置好每个模型的渲染状态,包括但不限于其材质(漫反射颜色,高光反射颜色贴图)、纹理、使用的Shader等。(恰好部分内容在之前写的光照渲染笔记中粗略学习了)

这一阶段最终的输出是渲染所需的几何信息,即渲染图元(Rendering Primitives) ,通俗来讲,渲染图元可以是点,线,三角面(3d图形学中的面都是三角面构成的),这些渲染图元最终会被传入到下一个阶段——几何阶段

几何阶段

几何阶段通常在GPU上进行,用于和每个渲染图元打交道,决定绘制什么图元,怎样绘制它们,在哪里绘制。

几何阶段会进行逐顶点,逐多边形的操作,当然内部可以分为更小的流水线阶段。几何阶段的一个重要任务就是把顶点坐标变换到屏幕空间中,再交给光栅器进行处理。通过对输入的渲染图元进行多步处理后,这一阶段将会输出屏幕空间的二维顶点坐标信息、每个顶点对应的深度值、着色器Shader等相关信息、并传递给下一个阶段。

光栅化阶段

这一阶段将会使用上个阶段传递的数据来产生屏幕上的像素,并渲染出最终的图像,这一阶段也是再GPU上运行的。光栅化的任务最终决定每个渲染图元中的哪些像素应该被绘制再屏幕上,它需要对上一个阶段得到的逐顶点数据(例如纹理坐标UV,顶点颜色等)进行插值,然后进行逐像素的处理。同样的,光栅化阶段也可以分成更小的流水线阶段。

犹记得n月前初学Unity刚看到这些知识,看的云里雾里。现在再看,能够理解其中的流程,真是收获良多。

原作者注:
要把上面的3个流水线阶段和我们将要讲到的 GPU 流水线阶段区分开来;这里的流水线均是概念流水线,是我们为了给一个渲染流程进行基本的功能划分而提出来的(也就是渲染图像的三个主要阶段)。下面要介绍的 GPU 流水线, 则是硬件真正用于实现上述概念的流水线(也就是GPU的工作流程)。


CPU和GPU的通信

渲染流水线的起点是CPU,也就是之前提到的应用阶段。该阶段可大致分为下列3个阶段:

  1. 把数据加载到显存
  2. 设置渲染状态
  3. 调用Draw Call

把数据加载到显存

所有需要渲染的数据都是存储在硬盘(HDD)中的(例如模型的网格体,贴图纹理等数据),然后数据从硬盘被加载到系统缓存中(RAM),最终从系统缓存又被加载到显卡上的存储空间(Video RAM)。因为显卡对于RAM没有直接访问权限,而被加载到显卡的显存VRAM中则可以直接访问,并且显卡对于显存的访问速度显然更快。(为什么固态硬盘可以提高游戏渲染速度也是因为加快了数据从硬盘缓存到RAM的速度)

在这里插入图片描述
当然,真实加载到显存的数据要复杂得多,例如顶点位置信息,法线方向,顶点颜色,纹理坐标等等。

当数据被加载到显存后,显卡就可以访问了。那么RAM中的数据也可以被移除,不过某些数据依然需要CPU的访问(例如网格数据,我们需要CPU通过网格数据计算碰撞检测),那么这些数据是不会被移除的,因为数据从硬盘加载到RAM是十分耗时的。

此外,开发者还需要通过CPU设计渲染状态,来指导GPU的渲染工作。

设置渲染状态

渲染状态定义了场景中的网格是怎样被渲染的。例如使用哪些个顶点着色器(Vertex Shader)/片元着色器(Fragment Shader)、光源属性、材质等。这些都是我们可以在程序阶段进行自定义的:

在这里插入图片描述
(上图显示了使用同一种材质在不同渲染状态设置下最终渲染出的三个网格)

在准备好了上述工作后,CPU需要一个命令来通知GPU可以进行渲染了,这个渲染指令就是Draw Call

调用Draw Call

在Unity中渲染优化经常需要优化DrawCall ,那么Draw Call 到底是什么?实际上它就是一个调用命令,直译一下下,Draw(绘画)Call(指令)。就是CPU对GPU发起的调用指令。这个命令会指向一个需要被渲染的图元(primitives ,这个单词倒是挺常用,也可以指代操作系统中的原语)列表,而不包含任何材质信息——因为所有材质、纹理、着色器等数据信息都在上一步设置渲染状态时被打包好了,实际上DrawCall是图像编程的一个调用接口,是CPU与GPU间的一种通信,类似于CPU打电话通知GPU:“我这里用到什么,该怎么用都全部准备好了,目标是那个图元,剩下的你知道该怎么做。”
在这里插入图片描述

(上图展示了Unity中渲管线的渲染流程,蓝色部分代表了CPU处理,被我们称为预渲染,绿色的部分则是GPU的处理,其中我们发现在Unity中还提供了一个后处理阶段,可以进行二次处理)

通过对原理的学习,我们发现即使是不同的教程,其内部知识也是融会贯通的,更方便我们多方考证。

那么调用了DrawCall之后,GPU就会根据CPU设定的渲染状态和所有输入的顶点数据来进行计算,最终输出成屏幕上显示的那些漂亮的像素,这个计算过程就是GPU流水线!

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1349319.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

BLP模型

本篇文章是调研了许多资料后对 BLP 模型的一个总结 首发公号:Rand_cs MLS,Multi-level Security,主要关心的是数据机密性 D. Elliott Bell 和 Leonard J. LaPadula 在 1996 年提出了基本的 BLP 模型,主要有两个性质:…

[线代]不挂科猴博士

行列式的性质 行列式的计算及应用 矩阵的运算上(加减,相乘,取行列式) 矩阵的运算下(转置,逆,秩) 向量组与线性空间 解方程组

openGauss学习笔记-182 openGauss 数据库运维-升级-升级前准备与检查

文章目录 openGauss学习笔记-182 openGauss 数据库运维-升级-升级前准备与检查182.1 升级前准备与检查清单182.2 收集节点信息182.3 备份数据182.4 获取升级包182.5 健康检查182.5.1 前提条件182.5.2 操作步骤 182.6 检查数据库节点磁盘使用率182.7 检查数据库状态182.7.1 验证…

exposure_line 是如何曝光的 ?

1、读者提问: exposure_line 是如何曝光的,我看网上说这个代表的是一帧曝光多少行, 那如果一帧 exposure_line 小于frame_length,那一帧后面的行就不曝光吗? 不知道怎么理解,是曝光到1500行,…

动态内存分配函数

malloc void* malloc( unsigned size) 申请size个字节的地址连续的内存单元 成功则返回指向内存块的指针, 失败则返回NULL malloc不对申请的空间初始化 calloc void*calloc(unsigned n,unsigmed size) 申请n* size字节的个地址连续的内…

骑砍战团MOD开发(30)-游戏大地图map.txt

骑砍1战团mod开发-大地图制作方法_哔哩哔哩_bilibilihttps://www.bilibili.com/video/BV1rz4y1c7wH/ 一.骑砍游戏大地图 骑砍RTS视角游戏大地图 大地图静态模型(map.txt) 军团/城镇图标(module_parties.py). 骑砍大地图的战争迷雾和天气通过API进行管理和控制: # Weather-h…

数据库视图学习

视图 视图(view)是一种虚拟存在的表。视图中的数据并不在数据库中实际存在,行和列数据来自定义视图的查询中使用的表,并且是在使用视图时动态生成的。通俗的讲,视图只保存了查询的SQL逻辑,不保存查询结果&…

Zookeeper注册中心实战

Java学习手册面试指南:https://javaxiaobear.cn Spring Cloud Zookeeper通过自动配置和绑定到 Spring 环境和其他 Spring 编程模型习惯用法,为 Spring Boot 应用程序提供Apache Zookeeper集成。通过一些简单的注释,您可以快速启用和配置应用…

一起学Elasticsearch系列-Mapping

本文已收录至Github,推荐阅读 👉 Java随想录 微信公众号:Java随想录 文章目录 Mapping 的基本概念查看索引 Mapping 字段数据类型数字类型基本数据类型Keywords 类型日期类型对象类型空间数据类型文档排名类型文本搜索类型 两种映射类型自动映…

IRQ Handler 的使用——以USART串口接收中断分别在标准库与HAL库版本下的举例

前言: 1.中断系统及EXTI外部中断知识点见我的博文: 9.中断系统、EXTI外部中断_eirq-CSDN博客文章浏览阅读301次,点赞7次,收藏6次。EXTI(Extern Interrupt)外部中断EXTI可以监测指定GPIO口的电平信号&…

Group k-fold解释和代码实现

Group k-fold解释和代码实现 文章目录 一、Group k-fold解释和代码实现是什么?二、 实验数据设置2.1 实验数据生成代码2.2 代码结果 三、实验代码3.1 实验代码3.2 实验结果3.3 结果解释 四、总结 一、Group k-fold解释和代码实现是什么? 0,1…

MP4文件中mvhd容器中的“下一个track ID”字段的作用是什么?(下一个轨道id)(新轨道id)

文章目录 mvhd容器中有以下字段其中有个“下一个track ID”字段不知道是干什么用的,它被放在这个mvhd容器的最后“下一个track ID”什么是“下一个track ID”“下一个track ID”的作用唯一性标识轨道管理 “下一个track ID”的必要性命令/代码演示 新轨道ID的含义和…

MySQL8.0 ROW_NUMBER 调用案例

ROW_NUMBER()是一个窗口函数或分析函数,它为从1开始应用的每一行分配一个序号。 创建表和生成所需要的数据 CREATE TABLE chapter11 ( shopname VARCHAR(255) NULL, sales VARCHAR(255) NULL, sale_date DATE NULL ); INSERT INTO chapter11 (shopname, sales, sal…

C语言之scanf浅析

前言&#xff1a; 当有了变量&#xff0c;我们需要给变量输入值就可以使用scanf函数&#xff0c;如果需要将变量的值输出在屏幕上的时候可以使用printf函数&#xff0c;如&#xff1a; #include <stdio.h> int main() {int score 0;printf("请输⼊成绩:");sc…

《2023年企业IoT和OT威胁报告》:物联网恶意软件攻击增长400%

内容概括&#xff1a; 物联网&#xff08;IoT&#xff09;设备无疑改变了我们生活、工作和管理运营技术&#xff08;OT&#xff09;环境的方式。总体而言&#xff0c;到2027年&#xff0c;全球物联网设备数量预计将超过290亿&#xff0c;比2023年的167亿大幅增加。设备和智能技…

中文数字的魅力:古今中外的传承与创新

一、引言 中文数字&#xff0c;作为世界上最古老、最具特色的数字系统之一&#xff0c;已经伴随着中华文化走过了几千年的历史。它既是我们祖先智慧的结晶&#xff0c;也是现代生活中不可或缺的元素。本文将从各个方面介绍和解释中文数字的用途&#xff0c;带领大家领略中文数…

Python编程新技能:如何优雅地实现水仙花数?

水仙花数&#xff08;Narcissistic number&#xff09;也被称为阿姆斯特朗数&#xff08;Armstrong number&#xff09;或自恋数等&#xff0c;它是一个非负整数&#xff0c;其特性是该数的每个位上的数字的n次幂之和等于它本身&#xff0c;其中n是该数的位数。简单来说&#x…

渗透线上下料控制(SCL源代码)

有关渗透线的其它详细介绍请参考下面链接文章&#xff1a; https://rxxw-control.blog.csdn.net/article/details/133611151https://rxxw-control.blog.csdn.net/article/details/133611151这里的渗透线上下料属于整个渗透线流程里的最前端和最后端&#xff0c;分别负责待处理…

Unity坦克大战开发全流程——游戏场景——主玩家——可击毁箱子

游戏场景——主玩家——可击毁箱子 添加特效 CubeObj的代码如下 using System.Collections; using System.Collections.Generic; using UnityEngine;public class CubeObj : MonoBehaviour {//关联的奖励物品public GameObject[] rewardObjects;//关联的特效public GameObject …

大模型入门0: 基础知识

transformerscaling law分布式训练 自然语言处理包括几大任务 NLP: 文本分类&#xff0c;词性标注&#xff0c;信息检索NLG&#xff1a;机器翻译&#xff0c;自动摘要&#xff0c;问答QA、对话机器ChatBot下游任务: 词性标注&#xff08;POS&#xff09;&#xff0c;句法分析…