GPU逻辑管线

GPU逻辑管线

news2025/11/8 19:36:42

文章目录

前言
一、渲染流水线
二、英伟达显卡简化概念图（GPU）
- 1、我们的Shader会调用英伟达提供的 API
- 2、调用API后，把Shader用到的指令存储在Pushbuffer中
- 3、然后图元分配器，会把模型数据和 Shader 指令传入GPU中
- 4、这个SM是每个小单元的内部结构
- 5、模型顶点数据准备好并且 Shader 指令准备好后，进入每一个 Core 中计算
- 6、顶点数据计算完成后，会进行顶点数据转化为裁剪空间，然后传入片元着色器计算
- 7、计算使用的还是 SM 单元，只是逻辑变了
- 8、纹理采样和纹理缓存在如下位置完成
- 9、如果我们在顶点着色器或片元着色器中使用了条件语句，我们的SM会按如下逻辑运行
- 10、然后最后完成颜色混合

前言

了解一下 GPU 逻辑管线

一、渲染流水线

在这里插入图片描述

二、英伟达显卡简化概念图（GPU）

在这里插入图片描述

1、我们的Shader会调用英伟达提供的 API

在这里插入图片描述

2、调用API后，把Shader用到的指令存储在Pushbuffer中

在这里插入图片描述

3、然后图元分配器，会把模型数据和 Shader 指令传入GPU中

在这里插入图片描述

4、这个SM是每个小单元的内部结构

在这里插入图片描述

5、模型顶点数据准备好并且 Shader 指令准备好后，进入每一个 Core 中计算

在这里插入图片描述

6、顶点数据计算完成后，会进行顶点数据转化为裁剪空间，然后传入片元着色器计算

在这里插入图片描述

7、计算使用的还是 SM 单元，只是逻辑变了

在这里插入图片描述

8、纹理采样和纹理缓存在如下位置完成

在这里插入图片描述

9、如果我们在顶点着色器或片元着色器中使用了条件语句，我们的SM会按如下逻辑运行

在这里插入图片描述

遇到 if 为 true，则通过Core计算。否则，会等待其他语句块的 if 计算完成后，进行else计算

在这里插入图片描述
如果我们的Shader中，存在条件分支语句、循环语句。
这是非常消耗性能的
因为,只要存在一个分支为false，那么对于同一排的Core计算
都需要等待运行 if 和 else 两个语句块的时间

10、然后最后完成颜色混合

在颜色混合阶段完成深度测试、模板测试等这些功能
在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1273202.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

VGN S99快捷键，说明书

VGN S99快捷键，说明书

VGN S99快捷键-说明书按键说明灯光效果常见疑难按键说明切换关闭电量指示灯：Fn home 灯光效果常见疑难

阅读更多...

GAN：WGAN

GAN：WGAN

论文：https://arxiv.org/pdf/1701.07875.pdf 发表：2017 WGAN 算法流程从GAN 到 WGAN 的转变相比于原始 GAN，WGAN 只需要修改以下几点，就能使得训练更稳定，生成质量更高： 1. 此时的判别器相当于做回归…

阅读更多...

ubuntu下QT搭建Android开发环境

ubuntu下QT搭建Android开发环境

一、前言用QT开发android和直接使用android开发的区别使用Qt开发Android应用和直接使用Android开发工具（例如Android Studio）有一些区别，主要体现在开发工具、语言、界面设计和性能等方面： 开发工具： Qt Creat…

阅读更多...

pycharm安装django框架详细教程（指定版本）

pycharm安装django框架详细教程（指定版本）

教程目录前言一、确保已安装好python和pycharm工具二、利用pycharm创建纯python项目，同时创建虚拟环境三、通过pycharm命令行安装Django指定版本四、通过pycharm命令行创建一个Django项目五、在pycharm中进行相关配置六、利用pycharm按钮启动Django项目前言在实…

阅读更多...

常用API—String（操作字符串的工具类）

常用API—String（操作字符串的工具类）

一，创建字符串的方法二，案例 public static void main(String[] args) {//1,直接创建String string "gears";System.out.println(string);//2，用对象创建String s1 new String("xiaoheizi");System.out.println(s1);//3…

阅读更多...

高效解决在本地打开可视化服务器端的tensorboard

高效解决在本地打开可视化服务器端的tensorboard

文章目录问题解决方案问题由于连着远程服务器构建模型，但是想在本地可视化却做不到，不要想当然天真的以为CTRLC点击链接http://localhost:6006就真能在本地打开tensorboard。你电脑都没连接服务器，只是pycharm连上了而已解决方案你需要…

阅读更多...

有趣的代码——井字棋游戏的实现

有趣的代码——井字棋游戏的实现

前面我们讲解过一个猜数字游戏的实现，想来应该让大家感受到了属于编程的趣味性，并且在实现过程中应该也收获了知识。但猜数字这种简单的游戏肯定满足不了大家对于游戏的高标注、严要求，估计玩不了多久就会没有兴趣了，所以&#xf…

阅读更多...

渗透测试-环境部署

渗透测试-环境部署

环境部署一、kali的环境部署二、DNSenum工具：深入挖掘目标域名的DNS信息三、安装Burpsuite四、安装根证书五、JSFinder的使用六、App、小程序、公众号提取一、kali的环境部署 1.配置SSH 修改配置文件 vi /etc/ssh/sshd_config 找到 # PermitRootLogin prohibit…

阅读更多...

收藏！7个小众宝藏的开发者学习类网站

收藏！7个小众宝藏的开发者学习类网站

1、simplilearn 地址：https://www.simplilearn.com/ simplilearn是全球排名第一的在线学习网站，它的课程由世界知名大学、顶级企业和领先的行业机构通过实时在线课程设计和提供，其中包括顶级行业从业者、广受欢迎的培训师和全球领导者。 2、…

阅读更多...

java springboot通过application配置文件生成随机值并控制范围

java springboot通过application配置文件生成随机值并控制范围

我们找到项目的 application 配置文件这里我们还是习惯用 yml格式的我们在配置文件中写出 ${random.} 的时候他就会将所有可配置的随机类型都提示出来了有整数长整星字符串 uuid 这里我们来个模板 testcase:book:id: ${random.int}name: ${random.value}date: ${r…

阅读更多...

[跑代码]BK-SDM: A Lightweight, Fast, and Cheap Version of Stable Diffusion

[跑代码]BK-SDM: A Lightweight, Fast, and Cheap Version of Stable Diffusion

Installation(下载代码-装环境) conda create -n bk-sdm python3.8 conda activate bk-sdm git clone https://github.com/Nota-NetsPresso/BK-SDM.git cd BK-SDM pip install -r requirements.txt Note on the torch versions weve used torch 1.13.1 for MS-COCO evaluation…

阅读更多...

了解ConcurrnetHashMap 吗？

了解ConcurrnetHashMap 吗？

程序员的公众号：源1024，获取更多资料，无加密无套路！ 最近整理了一波电子书籍资料，包含《Effective Java中文版第2版》《深入JAVA虚拟机》，《重构改善既有代码设计》，《MySQL高性能-第3版》&…

阅读更多...

kafka中的常见问题处理

kafka中的常见问题处理

文章目录 1. 如何防⽌消息丢失2. 如何防⽌重复消费3. 如何做到消息的顺序消费4. 如何解决消息积压问题4.1 消息积压问题的出现4.2 消息积压的解决⽅案 5. 实现延时队列的效果5.1 应用场景5.2 具体方案 1. 如何防⽌消息丢失⽣产者：1）使⽤同步发送 2&…

阅读更多...

决策树（Classification and Regression Tree）

决策树（Classification and Regression Tree）

学了数据结构的树后，一直没发现树有哪些应用。学而时习（实践）之，不亦说乎？故特地上网查了查树的应用，在下阐释： 1.文件系统：文件和目录的组织通常以树的形式表示，允许高效…

阅读更多...

掌握Python BentoML：构建、部署和管理机器学习模型

掌握Python BentoML：构建、部署和管理机器学习模型

更多资料获取 📚 个人网站：ipengtao.com BentoML是一个开源的Python框架，旨在简化机器学习模型的打包、部署和管理。本文将深入介绍BentoML的功能和用法，提供详细的示例代码和解释，帮助你更好地理解和应用这个强大的工…

阅读更多...

【C++】异常处理 ③ ( 栈解旋 | 栈解旋概念 | 栈解旋作用 )

【C++】异常处理 ③ ( 栈解旋 | 栈解旋概念 | 栈解旋作用 )

文章目录一、栈解旋1、栈解旋引入2、栈解旋概念3、栈解旋作用二、代码示例 - 栈解旋1、代码示例2、执行结果一、栈解旋 1、栈解旋引入 C 程序抛出异常后对局部变量的处理 : 当 C 应用程序在运行过程中发生异常时 , 程序会跳转到异常处理程序 , 并执行一些操作以处理异…

阅读更多...

10.30 作业 C++

10.30 作业 C++

设计一个Per类，类中包含私有成员:姓名、年龄、指针成员身高、体重，再设计一个Stu类，类中包含私有成员:成绩、Per类对象p1，设计这两个类的构造函数、析构函数和拷贝构造函数。 #include <iostream>using namespace std;clas…

阅读更多...

【C语言学习疑难杂症】第6期：C语言中如何打印一些特殊字符，比如打印扩展ascii码字符

【C语言学习疑难杂症】第6期：C语言中如何打印一些特殊字符，比如打印扩展ascii码字符

首先我们来看下ascii表和ascii拓展表： ascii表中的字符只有128个，是从0-127，而拓展ascii表的内容是128-255。拓展表中它们都是一些特殊的字符，如果我们想答应ascii拓展码中的一些字符应该要怎么操作呢？比如下面的代码： unsigned char a = 176, b = 219;printf("%…

阅读更多...

客餐书房一体布局，新中式风格禅意十足。福州中宅装饰，福州装修

客餐书房一体布局，新中式风格禅意十足。福州中宅装饰，福州装修

你是否曾经遇到过这样的痛点：装修时不知道该选择什么样的风格，让家居空间显得既时尚又实用？如果你对此感到困惑，那么新中式风格可能正是你想要的选择！ 今天，我们将一起探讨一种别样的家居布局，它…

阅读更多...

openGauss学习笔记-136 openGauss 数据库运维-例行维护-检查数据库性能

openGauss学习笔记-136 openGauss 数据库运维-例行维护-检查数据库性能

文章目录 openGauss学习笔记-136 openGauss 数据库运维-例行维护-检查数据库性能136.1 检查办法136.2 异常处理 openGauss学习笔记-136 openGauss 数据库运维-例行维护-检查数据库性能 136.1 检查办法通过openGauss提供的性能统计工具gs_checkperf可以对硬件性能进行检查。 …

阅读更多...

推荐文章

最新文章