我使用了一個以前版本的Nvidia profiler來分析l1和l2緩存命中率,但我不確定我使用了哪個版本。看起來cuda 4.2可視化剖析器沒有L1和L2剖析信息(全局緩存重播開銷除外)。如何使用cuda 4.2(或特定的以前版本)可視化/命令行分析器來剖析L1或L2緩存命中率?如何在Linux上使用cuda 4.2 profiler在GTX480上分析L1和L2緩存命中率?
1
A
回答
1
不知道如果你使用的是Windows或Linux,但是你有用於MS Visual Studio的Parallel Nsight(還有一個用於eclipse的版本)的windows。 Nsight可以讓你定義許多不同的「實驗」。即使你可以使用「自定義」實驗。如果您選擇「內存」實驗,它將包含所需的L1和L2高速緩存命中率。我附上截圖顯示
這是取自NSight paralell 3.0,但它也可用於以前的版本。
編輯:
使用視覺分析器(版本至少爲5.0,但我想以前的版本將是相似的),你可以設置你是什麼樣的事件和指標興趣上,在Visual探查5.0,你可以打運行 - - >配置度量和事件。在附加窗口中,您可以設置任何要觀看的計數器。可用的度量和事件將取決於底層硬件(即GPU具有的可訪問的計數器)。在我的GTX附加圖片的一些存儲櫃480
EDITED 2: 好只注意到你正在編輯原來的問題後,要求對Linux ...所以對Linux我不知道,如果nVidia提供了這樣的一個Visual Profiler(我猜他們會這樣做)。如果沒有,您可能會對Eclipse NSight版本感興趣...
相關問題
- 1. CUDA編程 - L1和L2高速緩存
- 2. 如何在CUDA中使用L2緩存
- 3. 如何查找L1和L2緩存?
- 4. 查找緩存L1和L2帶寬
- 5. 使用nvprof分析CUDA計算功能3.x上的L2緩存
- 6. 如何看到L1緩存未命中/命中python分析?
- 7. 從L1緩存驅逐L2驅逐
- 8. l1緩存和l2緩存有什麼區別?
- 9. 測量L1和L2高速緩存的大小和順序
- 10. 如何在OpenCL上使用NVidia Visual Profiler(在Linux上)?
- 11. L1和L2緩存由操作系統管理?
- 12. 正規語言,L1和L2
- 13. 如何控制分配的內存是否存儲在L1,L2,L3緩存或其他JavaScript中?
- 14. CUDA:FERMI上的紋理緩存是否與L1緩存分開?
- 15. l1是一個列表,l2 = l1;爲什麼「l2 = l2 + [item]」會影響l1而「l2 + = [item]」呢?
- 16. NVidia CUDA:緩存L2和多個內核調用
- 17. 在PyTorch中添加L1/L2正則化?
- 18. 如何在Linux上使用Vtune Analyzer API
- 19. 如何在MACOSX上使用GLUT和CUDA?
- 20. 處理器x86/x86_64中是否使用物理或虛擬尋址在L1,L2和L3中緩存?
- 21. 的Cortex A53 L1 L2高速緩存信息
- 22. 在我們的系統中查找L1 L2 L3高速緩存詳細信息
- 23. CUDA:何時使用共享內存以及何時依賴L1緩存?
- 24. 在CUDA中剖析常量緩存
- 25. 如何在Linux上編譯KNN CUDA?
- 26. 如何在Linux上不使用CUDA使用TensorFlow?
- 27. L1和L2目錄的魷魚數
- 28. JDO L2緩存SingleFieldIdentity
- 29. 能源模型()中的l1和l2在ns2中的含義
- 30. 用perf和papi測量L1數據緩存未命中
謝謝您的回答。我提出了它並更新了我的問題。 – dalibocai 2013-03-19 17:23:18