欢迎关注我的公众号 [极智视界],获取我的更多经验分享
大家好,我是极智视界,本文分享一下 CUDA线程全局索引计算方式。
邀您加入我的知识星球「极智视界」,星球内有超多好玩的项目实战源码和资源下载,链接:https://t.zsxq.com/0aiNxERDq
CUDA 线程全局索引的计算,是很容易混淆的概念,因为 CUDA 线程模型的矩阵排布和咱们通常理解的数学矩阵排布秩序不太一样。在谈论这个话题前,还是要先看下下面这张 CUDA 线程层次模型图,关键先要对 Grid、Block、Thread 有个清晰的概念,如下,(需要注意的是,下面是 CUDA12 中的线程模型,新引入了一个 Thread Block Cluster 结构),
基本关系是 Thread 在一起组成了 Block,Block 在一起组成了 Grid,所以是 Grid 包含 Block 再包含 Thread 的关系。为了便于讲解以及回归最经典的 CUDA 线程模型,下面还有张更加清晰的图可以表达,