1
我用--ptax選項= -v在編譯我的.CU代碼,它給了以下內容:CUDA佔用率計算器,
ptxas info: Used 74 registers, 124 bytes smem, 16 bytes cmem[1]
devQuery我的卡返回如下:
rev: 2.0
name: tesla c2050
total shared memory per block: 49152
total reg. per block: 32768
現在,我輸入這些數據到CUDA佔有率計算器如下:
1.) 2.0
1.b) 49152
2.) threads per block: x
registers per thread: 74
shared memory per block (bytes): 124
我被改變X(每個塊的線程)使得x * 74 < = 32768。例如,我輸入128(或256)代替x。我是否正確輸入佔用率計算器輸入的所有必需值?謝謝。
在我的情況下,我有'sm_13'(-arch = sm_13),並且我只將內核調用爲<<< GridDim,BlockDim >>>。所以我必須這樣做:設置字段1 = 1.3;設置欄位2 = 74;設置字段3 = 124.這是正確的嗎?謝謝! – tiki 2013-02-26 03:02:58
@torem是的,這是正確的。 – 2013-02-27 17:14:47