我一直在分析nvprof and nvvp (5.5)
的應用程序以優化它。不過,我得到像inst_replay_overhead
,ipc
或branch_efficiency
,當我剖析調試(-G
)等一些指標/事件完全不同的結果,併發布代碼的版本。配置文件調試或釋放cuda代碼?
所以我的問題是:哪個版本我應該個人資料?發行版或調試版?或者選擇取決於我在找什麼?
我發現CUDA - Visual Profiler and Control Flow Divergence其中聲明需要調試(-G
)版本才能正確測量發散分支指標,但我不確定其他指標。
我沒有在您提供的鏈接中看到任何內容,說明需要-G才能正確測量發散分支指標。被引用的特定分析器功能(反向引用源代碼)可以使用發行版或調試版來完成,如在那裏提供的答案中所述。 –
Robert Crovella,你是對的。鏈接中的來源提供了兩個選項,我不提這一點。謝謝。 – ScHuMi