如何在Linux上使用cuda 4.2 profiler在GTX480上分析L1和L2緩存命中率？

我使用了一個以前版本的Nvidia profiler來分析l1和l2緩存命中率，但我不確定我使用了哪個版本。看起來cuda 4.2可視化剖析器沒有L1和L2剖析信息（全局緩存重播開銷除外）。如何使用cuda 4.2（或特定的以前版本）可視化/命令行分析器來剖析L1或L2緩存命中率？如何在Linux上使用cuda 4.2 profiler在GTX480上分析L1和L2緩存命中率？

來源

2013-03-18 dalibocai

不知道如果你使用的是Windows或Linux，但是你有用於MS Visual Studio的Parallel Nsight（還有一個用於eclipse的版本）的windows。 Nsight可以讓你定義許多不同的「實驗」。即使你可以使用「自定義」實驗。如果您選擇「內存」實驗，它將包含所需的L1和L2高速緩存命中率。我附上截圖顯示 Parallel Nsight Performance screenshot

這是取自NSight paralell 3.0，但它也可用於以前的版本。

編輯：

使用視覺分析器（版本至少爲5.0，但我想以前的版本將是相似的），你可以設置你是什麼樣的事件和指標興趣上，在Visual探查5.0，你可以打運行 - - >配置度量和事件。在附加窗口中，您可以設置任何要觀看的計數器。可用的度量和事件將取決於底層硬件（即GPU具有的可訪問的計數器）。在我的GTX附加圖片的一些存儲櫃480 Cache Events GTX 480 visual profiler 5.0

EDITED 2： 好只注意到你正在編輯原來的問題後，要求對Linux ...所以對Linux我不知道，如果nVidia提供了這樣的一個Visual Profiler（我猜他們會這樣做）。如果沒有，您可能會對Eclipse NSight版本感興趣...

來源

2013-03-19 08:12:51 Dredok

謝謝您的回答。我提出了它並更新了我的問題。 – dalibocai 2013-03-19 17:23:18

如何在Linux上使用cuda 4.2 profiler在GTX480上分析L1和L2緩存命中率？

回答

相關問題