0
有什麼辦法從CUDA的設備內核觸發事件(用於基準測試目的,類似於CPU代碼中的cudaEvents)?CUDA - 來自內核的事件
E.g.假設我想測量從內核啓動到啓動計算的第一個線程的時間以及從最後一個離開計算到CPU返回的線程所經過的時間。
我能做到這一點?
有什麼辦法從CUDA的設備內核觸發事件(用於基準測試目的,類似於CPU代碼中的cudaEvents)?CUDA - 來自內核的事件
E.g.假設我想測量從內核啓動到啓動計算的第一個線程的時間以及從最後一個離開計算到CPU返回的線程所經過的時間。
我能做到這一點?
設備運行時API(與動態並行性一起使用)確實有limited stream and events support,但事件時序不受支持。
所以,不,你不能這樣做。