4
CUDA CC3.0的新l1_shared_bank_conflict(或等效計數器)計數器是什麼? 在CUPTI用戶指南中,它表示shared_ [load | store] _bank_conflict,但它在我嘗試時沒有顯示。l1 CUDA CC 3.0共享銀行衝突分析器計數器
我在Linux中使用命令行分析器。
CUDA CC3.0的新l1_shared_bank_conflict(或等效計數器)計數器是什麼? 在CUPTI用戶指南中,它表示shared_ [load | store] _bank_conflict,但它在我嘗試時沒有顯示。l1 CUDA CC 3.0共享銀行衝突分析器計數器
我在Linux中使用命令行分析器。
舊命令行分析器不支持某些新計數器。如果您正在使用CUDA 5,你可以嘗試nvprof:
nvprof --events l1_shared_bank_conflict <app_name>
nvprof --query-events
見http://docs.nvidia.com/cuda/profiler-users-guide/index.html#nvprof-overview
感謝@Joe。它實際上是shared_ [load | store] _replay。 --query-events選項非常有用! – ardiyu07