2013-02-26 22 views

回答

3

Nsight Visual Studio Edition 3.0 CUDA Profiler引入了源相關實驗。本概要CUDA活動支持以下源水平的實驗:

  • 指令計數 - 收集所執行的指令,執行的線程的指令,活動線程直方圖,預測螺紋直方圖在內核中的每個用戶指令。系統調用信息(printf)未被收集。

  • 發散分支 - 收集分支採集,未採用分支和流量控制指令的分歧計數。

  • 內存事務 - 收集交易數量,交易的理想櫃檯,並要求字節爲全球,本地和共享內存的指令。

該信息按照SASS指令收集。如果使用-lineinfo(--generate-line-info)編譯內核,則可以將信息彙總到PTX和高級別源代碼。由於這些數據是從SASS捲起來的,因此一些統計數據可能對高層來源不直觀。例如,分支統計信息可能會在預計100%採取時顯示爲100%。如果您查看SASS代碼,您可能會看到編譯器顛倒了條件。

請不要在優化的版本上編譯器有時無法維護線表信息。

enter image description here

此時的硬件性能計數器和時間僅可在內核級別。

設備代碼時序可以使用clock()和clock64()來完成,如註釋中所述。這是一項非常先進的技術,它需要能夠理解SASS並解釋關於SM warp調度程序的結果。

+0

謝謝。它看起來很難但很有趣。你知道Nsight 3.0何時會發布嗎? – Seltymar 2013-02-28 08:57:54

相關問題