0
我搜索了一下,但是我發現的所有東西只能用CPU代碼註釋,我怎麼能測量1個線程塊的2 _syncthread()之間的內核內的部分時間?可能嗎?CUDA測量2 _syncthread()之間的時間點
我搜索了一下,但是我發現的所有東西只能用CPU代碼註釋,我怎麼能測量1個線程塊的2 _syncthread()之間的內核內的部分時間?可能嗎?CUDA測量2 _syncthread()之間的時間點
一種方法是使用描述爲in the programming guide的clock()
或clock64
函數。
在clock64
上搜索cuda標記以獲取其用法的其他示例。