GPU逻辑管线

news2024/9/22 1:31:40

文章目录

  • 前言
  • 一、渲染流水线
  • 二、英伟达显卡简化概念图(GPU)
    • 1、我们的Shader会调用英伟达提供的 API
    • 2、调用API后,把Shader用到的指令存储在Pushbuffer中
    • 3、然后图元分配器,会把 模型数据 和 Shader 指令传入GPU中
    • 4、这个SM是每个小单元的内部结构
    • 5、模型顶点数据准备好 并且 Shader 指令准备好后,进入每一个 Core 中计算
    • 6、顶点数据计算完成后,会进行顶点数据转化为裁剪空间,然后传入片元着色器计算
    • 7、计算使用的还是 SM 单元,只是逻辑变了
    • 8、纹理采样 和 纹理缓存 在如下位置完成
    • 9、如果我们在 顶点着色器 或 片元着色器 中使用了条件语句,我们的SM会按如下逻辑运行
    • 10、然后最后完成颜色混合


前言

了解一下 GPU 逻辑管线


一、渲染流水线

在这里插入图片描述


二、英伟达显卡简化概念图(GPU)

在这里插入图片描述

1、我们的Shader会调用英伟达提供的 API

在这里插入图片描述

2、调用API后,把Shader用到的指令存储在Pushbuffer中

在这里插入图片描述

3、然后图元分配器,会把 模型数据 和 Shader 指令传入GPU中

在这里插入图片描述

4、这个SM是每个小单元的内部结构

在这里插入图片描述

5、模型顶点数据准备好 并且 Shader 指令准备好后,进入每一个 Core 中计算

在这里插入图片描述

6、顶点数据计算完成后,会进行顶点数据转化为裁剪空间,然后传入片元着色器计算

在这里插入图片描述

7、计算使用的还是 SM 单元,只是逻辑变了

在这里插入图片描述

8、纹理采样 和 纹理缓存 在如下位置完成

在这里插入图片描述

9、如果我们在 顶点着色器 或 片元着色器 中使用了条件语句,我们的SM会按如下逻辑运行

在这里插入图片描述

遇到 if 为 true,则通过Core计算。否则,会等待其他语句块的 if 计算完成后,进行else计算

在这里插入图片描述
如果我们的Shader中,存在条件分支语句、循环语句。
这是非常消耗性能的
因为,只要存在一个分支为false,那么对于同一排的Core计算
都需要等待运行 if 和 else 两个语句块的时间

10、然后最后完成颜色混合

在颜色混合阶段完成 深度测试、模板测试等这些功能
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1273202.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

VGN S99快捷键,说明书

VGN S99快捷键-说明书 按键说明灯光效果常见疑难 按键说明 切换关闭电量指示灯:Fn home 灯光效果 常见疑难

GAN:WGAN

论文:https://arxiv.org/pdf/1701.07875.pdf 发表:2017 WGAN 算法流程 从GAN 到 WGAN 的转变 相比于原始 GAN,WGAN 只需要修改以下几点,就能使得训练更稳定,生成质量更高: 1. 此时的判别器相当于做回归…

ubuntu下QT搭建Android开发环境

一、前言 用QT开发android和直接使用android开发的区别 使用Qt开发Android应用和直接使用Android开发工具(例如Android Studio)有一些区别,主要体现在开发工具、语言、界面设计和性能等方面: 开发工具: Qt Creat…

pycharm安装django框架详细教程(指定版本)

教程目录 前言一、确保已安装好python和pycharm工具二、利用pycharm创建纯python项目,同时创建虚拟环境三、通过pycharm命令行安装Django指定版本四、通过pycharm命令行创建一个Django项目五、在pycharm中进行相关配置六、利用pycharm按钮启动Django项目 前言 在实…

常用API—String(操作字符串的工具类)

一,创建字符串的方法 二,案例 public static void main(String[] args) {//1,直接创建String string "gears";System.out.println(string);//2,用对象创建String s1 new String("xiaoheizi");System.out.println(s1);//3…

高效解决在本地打开可视化服务器端的tensorboard

文章目录 问题解决方案 问题 由于连着远程服务器构建模型,但是想在本地可视化却做不到,不要想当然天真的以为CTRLC点击链接http://localhost:6006就真能在本地打开tensorboard。你电脑都没连接服务器,只是pycharm连上了而已 解决方案 你需要…

有趣的代码——井字棋游戏的实现

前面我们讲解过一个猜数字游戏的实现,想来应该让大家感受到了属于编程的趣味性,并且在实现过程中应该也收获了知识。但猜数字这种简单的游戏肯定满足不了大家对于游戏的高标注、严要求,估计玩不了多久就会没有兴趣了,所以&#xf…

渗透测试-环境部署

环境部署 一、kali的环境部署二、DNSenum工具:深入挖掘目标域名的DNS信息三、安装Burpsuite四、安装根证书五、JSFinder的使用六、App、小程序、公众号提取 一、kali的环境部署 1.配置SSH 修改配置文件 vi /etc/ssh/sshd_config 找到 # PermitRootLogin prohibit…

收藏!7个小众宝藏的开发者学习类网站

1、simplilearn 地址:https://www.simplilearn.com/ simplilearn是全球排名第一的在线学习网站,它的课程由世界知名大学、顶级企业和领先的行业机构通过实时在线课程设计和提供,其中包括顶级行业从业者、广受欢迎的培训师和全球领导者。 2、…

java springboot通过application配置文件生成随机值并控制范围

我们找到 项目的 application 配置文件 这里我们还是习惯用 yml格式的 我们在配置文件中 写出 ${random.} 的时候 他就会将所有可配置的随机类型都提示出来了 有 整数 长整星 字符串 uuid 这里 我们来个模板 testcase:book:id: ${random.int}name: ${random.value}date: ${r…

[跑代码]BK-SDM: A Lightweight, Fast, and Cheap Version of Stable Diffusion

Installation(下载代码-装环境) conda create -n bk-sdm python3.8 conda activate bk-sdm git clone https://github.com/Nota-NetsPresso/BK-SDM.git cd BK-SDM pip install -r requirements.txt Note on the torch versions weve used torch 1.13.1 for MS-COCO evaluation…

了解ConcurrnetHashMap 吗?

程序员的公众号:源1024,获取更多资料,无加密无套路! 最近整理了一波电子书籍资料,包含《Effective Java中文版 第2版》《深入JAVA虚拟机》,《重构改善既有代码设计》,《MySQL高性能-第3版》&…

kafka中的常见问题处理

文章目录 1. 如何防⽌消息丢失2. 如何防⽌重复消费3. 如何做到消息的顺序消费4. 如何解决消息积压问题4.1 消息积压问题的出现4.2 消息积压的解决⽅案 5. 实现延时队列的效果5.1 应用场景5.2 具体方案 1. 如何防⽌消息丢失 ⽣产者:1)使⽤同步发送 2&…

决策树(Classification and Regression Tree)

学了数据结构的树后,一直没发现树有哪些应用。学而时习(实践)之,不亦说乎?故特地上网查了查树的应用,在下阐释: 1.文件系统:文件和目录的组织通常以树的形式表示,允许高效…

掌握Python BentoML:构建、部署和管理机器学习模型

更多资料获取 📚 个人网站:ipengtao.com BentoML是一个开源的Python框架,旨在简化机器学习模型的打包、部署和管理。本文将深入介绍BentoML的功能和用法,提供详细的示例代码和解释,帮助你更好地理解和应用这个强大的工…

【C++】异常处理 ③ ( 栈解旋 | 栈解旋概念 | 栈解旋作用 )

文章目录 一、栈解旋1、栈解旋引入2、栈解旋概念3、栈解旋作用 二、代码示例 - 栈解旋1、代码示例2、执行结果 一、栈解旋 1、栈解旋引入 C 程序 抛出异常后 对 局部变量的处理 : 当 C 应用程序 在 运行过程 中发生异常时 , 程序会跳转到异常处理程序 , 并执行一些操作以处理异…

10.30 作业 C++

设计一个Per类&#xff0c;类中包含私有成员:姓名、年龄、指针成员身高、体重&#xff0c;再设计一个Stu类&#xff0c;类中包含私有成员:成绩、Per类对象p1&#xff0c;设计这两个类的构造函数、析构函数和拷贝构造函数。 #include <iostream>using namespace std;clas…

【C语言学习疑难杂症】第6期:C语言中如何打印一些特殊字符,比如打印扩展ascii码字符

首先我们来看下ascii表和ascii拓展表: ascii表中的字符只有128个,是从0-127,而拓展ascii表的内容是128-255。拓展表中它们都是一些特殊的字符,如果我们想答应ascii拓展码中的一些字符应该要怎么操作呢? 比如下面的代码: unsigned char a = 176, b = 219;printf("%…

客餐书房一体布局,新中式风格禅意十足。福州中宅装饰,福州装修

你是否曾经遇到过这样的痛点&#xff1a;装修时不知道该选择什么样的风格&#xff0c;让家居空间显得既时尚又实用&#xff1f;如果你对此感到困惑&#xff0c;那么新中式风格可能正是你想要的选择&#xff01; 今天&#xff0c;我们将一起探讨一种别样的家居布局&#xff0c;它…

openGauss学习笔记-136 openGauss 数据库运维-例行维护-检查数据库性能

文章目录 openGauss学习笔记-136 openGauss 数据库运维-例行维护-检查数据库性能136.1 检查办法136.2 异常处理 openGauss学习笔记-136 openGauss 数据库运维-例行维护-检查数据库性能 136.1 检查办法 通过openGauss提供的性能统计工具gs_checkperf可以对硬件性能进行检查。 …