a亚洲精品_精品国产91乱码一区二区三区_亚洲精品在线免费观看视频_欧美日韩亚洲国产综合_久久久久久久久久久成人_在线区

首頁 > 學院 > 開發設計 > 正文

CUDA軟件架構—網格(Grid)、線程塊(Block)和線程(Thread)的組織關系以及線程索引的計算公式

2019-11-14 09:49:49
字體:
來源:轉載
供稿:網友

網格(Grid)、線程塊(Block)和線程(Thread)的組織關系

CUDA的軟件架構由網格(Grid)、線程塊(Block)和線程(Thread)組成,相當于把GPU上的計算單元分為若干(2~3)個網格,每個網格內包含若干(65535)個線程塊,每個線程塊包含若干(512)個線程,三者的關系如下圖:

Thread,block,grid是CUDA編程上的概念,為了方便程序員軟件設計,組織線程。

thread:一個CUDA的并行程序會被以許多個threads來執行。block:數個threads會被群組成一個block,同一個block中的threads可以同步,也可以通過shared memory通信。grid:多個blocks則會再構成grid。

網格(Grid)、線程塊(Block)和線程(Thread)的最大數量

CUDA中可以創建的網格數量跟GPU的計算能力有關,可創建的Grid、Block和Thread的最大數量參看以下表格:在單一維度上,程序的執行可以由多達3*65535*512=100661760(一億)個線程并行執行,這對在CPU上創建并行線程來說是不可想象的。

線程索引的計算公式

一個Grid可以包含多個Blocks,Blocks的組織方式可以是一維的,二維或者三維的。block包含多個Threads,這些Threads的組織方式也可以是一維,二維或者三維的。CUDA中每一個線程都有一個唯一的標識ID—ThreadIdx,這個ID隨著Grid和Block的劃分方式的不同而變化,這里給出Grid和Block不同劃分方式下線程索引ID的計算公式。1、 grid劃分成1維,block劃分為1維    int threadId = blockIdx.x *blockDim.x + threadIdx.x;        2、 grid劃分成1維,block劃分為2維      int threadId = blockIdx.x * blockDim.x * blockDim.y+ threadIdx.y * blockDim.x + threadIdx.x;      3、 grid劃分成1維,block劃分為3維      int threadId = blockIdx.x * blockDim.x * blockDim.y * blockDim.z                         + threadIdx.z * blockDim.y * blockDim.x                         + threadIdx.y * blockDim.x + threadIdx.x;    4、 grid劃分成2維,block劃分為1維      int blockId = blockIdx.y * gridDim.x + blockIdx.x;      int threadId = blockId * blockDim.x + threadIdx.x;       5、 grid劃分成2維,block劃分為2維     int blockId = blockIdx.x + blockIdx.y * gridDim.x;      int threadId = blockId * (blockDim.x * blockDim.y)                         + (threadIdx.y * blockDim.x) + threadIdx.x;        6、 grid劃分成2維,block劃分為3維    int blockId = blockIdx.x + blockIdx.y * gridDim.x;      int threadId = blockId * (blockDim.x * blockDim.y * blockDim.z)                         + (threadIdx.z * (blockDim.x * blockDim.y))                         + (threadIdx.y * blockDim.x) + threadIdx.x;       7、 grid劃分成3維,block劃分為1維     int blockId = blockIdx.x + blockIdx.y * gridDim.x                       + gridDim.x * gridDim.y * blockIdx.z;      int threadId = blockId * blockDim.x + threadIdx.x;       8、 grid劃分成3維,block劃分為2維      int blockId = blockIdx.x + blockIdx.y * gridDim.x                       + gridDim.x * gridDim.y * blockIdx.z;      int threadId = blockId * (blockDim.x * blockDim.y)                         + (threadIdx.y * blockDim.x) + threadIdx.x;       9、 grid劃分成3維,block劃分為3維    int blockId = blockIdx.x + blockIdx.y * gridDim.x                       + gridDim.x * gridDim.y * blockIdx.z;      int threadId = blockId * (blockDim.x * blockDim.y * blockDim.z)                         + (threadIdx.z * (blockDim.x * blockDim.y))                         + (threadIdx.y * blockDim.x) + threadIdx.x;     


上一篇:快排算法

下一篇:IO流知識小結(一)

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: av官网| 国产电影一区二区在线观看 | 欧美精品一区二区三区四区 | xxx在线| 欧美日韩成人免费 | 黄色影片网址 | 国产精品一区自拍 | 日韩精品999 | 亚洲免费三级 | 一区二区三区视频 | 黄a在线看 | 成人av免费看| 午夜久久 | 欧美色成人 | 91精品国产乱码久 | 欧美亚洲国产一区 | 国产中文字幕一区二区三区 | 在线视频 亚洲 | 黄色免费网站 | 日韩精品无码一区二区三区 | 免费特级黄毛片 | 怡红院免费在线视频 | 日韩一区二区三区四区五区六区 | 色999国产| 欧美午夜一区二区三区免费大片 | 亚洲网站久久 | 男人操女人bb | 伊人影院在线观看 | 国产成人免费 | 麻豆精品国产91久久久久久 | 国产拍拍拍拍拍拍拍拍拍拍拍拍拍 | 欧美男人天堂 | h在线观看 | 日韩精品一区二区三区中文在线 | 中国一级大黄大黄大色毛片 | 91国内精品| 夜夜精品视频 | 久久精品国产一区 | 欧美日韩国产在线观看 | 一区二区免费视频观看 | 天天舔天天干 |