2
根據http://en.wikipedia.org/wiki/CUDA, 最大x或塊的y維度的塊的1024 最大z維度64CUDA 2D,3D線程塊
莫非我們可以有1024×1024×64個線程每塊或者我們可以在一個塊中最多有1024 + 64個線程?
根據http://en.wikipedia.org/wiki/CUDA, 最大x或塊的y維度的塊的1024 最大z維度64CUDA 2D,3D線程塊
莫非我們可以有1024×1024×64個線程每塊或者我們可以在一個塊中最多有1024 + 64個線程?
該限制在最近編程指南的附錄G中定義,但答案是512或1024個線程,每個塊總計,具體取決於您是否擁有Fermi卡或舊卡。
所以對於費米
blockDim.x * blockDim.y * blockDim.z <= 1024
和GT200/G90/G80 /離子:
blockDim.x * blockDim.y * blockDim.z <= 512
注意其他的資源限制(共享存儲器和寄存器),這可能需要塊大小是小於限制,取決於代碼的複雜性。編程指南中也會詳細討論這一點。
我認爲這種混淆是,在手冊中它說「最大尺寸」是指該參數*的最大值,但是在每塊有多少線程的限制內。 – koan