4
我剛剛從Why only one of the warps is executed by a SM in cuda?得知Kepler GPU可以一次執行幾條(顯然是4條)的指令。CUDA:不同經紗之間的銀行衝突?
共享內存銀行可以同時提供四個請求嗎?如果不是這樣,那意味着即使在任何單獨的warp中沒有銀行衝突,銀行衝突也可能發生在恰好同時執行的不同warp線程之間,對嗎?有沒有關於這方面的任何信息?
我剛剛從Why only one of the warps is executed by a SM in cuda?得知Kepler GPU可以一次執行幾條(顯然是4條)的指令。CUDA:不同經紗之間的銀行衝突?
共享內存銀行可以同時提供四個請求嗎?如果不是這樣,那意味着即使在任何單獨的warp中沒有銀行衝突,銀行衝突也可能發生在恰好同時執行的不同warp線程之間,對嗎?有沒有關於這方面的任何信息?
計算能力3.x設備(開普勒)每個SM有4個warps調度器。在每個循環中,每個warp調度程序選擇一個warp並從warp發出1-2條指令。 SM只有一個負載存儲單元(LSU)單元,它爲L1和共享內存請求提供服務,因此只有8條潛在指令中的1個可以分派給LSU,所以經線之間的存儲衝突不會發生。