因此,cuda可視化剖析器中有2個定時器,cuda可視化剖析器中的CPU和GPU定時器
GPU時間:這是GPU上該方法的執行時間。 CPU時間:它是啓動該方法的GPU時間和CPU開銷的總和。在驅動程序生成的數據級別,CPU時間僅僅是啓動非阻塞方法的方法的CPU開銷;對於阻塞方法,它是GPU時間和CPU開銷的總和。所有內核默認啓動都是非阻塞的。但是如果任何分析器計數器被啓用,則內核啓動將被阻止。不同流中的異步內存複製請求是非阻塞的。
如果我有一個真正的程序,實際的exectuion時間是多少?我測量時間,還有GPU計時器和CPU計時器,有什麼不同?
我想你已經回答了你自己的問題。 – erjiang 2010-12-04 02:13:58