首先,grid拿到用户指定的形状
那么发布任务,就每次增长block的size,如下
那么这个threadblock就直到自己在哪个位置
也就是grid任务拆成block,是依赖形状
关于block如何分成warp,发现是blocksize来拆,blocksize是一个block所需要的总的线程数字,也就是说,这里是依赖所需要跑的warp总数来发布任务
那我们看看warp有什么信息
这里的warp就多一个block的信息,相当于warp是直到自己属于哪个block
所以这里算的是线程在block里面的坐标位置。
然后这部分嵌套在csr指令里面,也就是读特殊的csr,会去执行getthreadid的操作,然后把threadid放到变量里