1
我正在遠程工作在Linux環境中的一些CUDA程序。由於X-forwarding存在問題,我不能使用CUDA Visual Profiler,而必須使用CUDA命令行分析器。爲什麼CUDA命令行分析器不能識別某些計數器?
問題是,它不能識別我希望遵循的一些基本計數器。如運行程序使用以下命令
COMPUTE_PROFILE=1 COMPUTE_PROFILE_CSV=0 COMPUTE_PROFILE_LOG=log \
CUDA_PROFILE_CONFIG=Config.txt ./my_program
隨着CONFIG.TXT文件之中:
warp_serialize
shared_replay_overhead
結果在下面的日誌:
NV_Warning: Ignoring the invalid profiler config option: warp_serialize
NV_Warning: Ignoring the invalid profiler config option: shared_replay_overhead
CUDA_PROFILE_LOG_VERSION 2.0
CUDA_DEVICE 0 GeForce GTX 580
CUDA_CONTEXT 1
TIMESTAMPFACTOR fffff6c8b2653dd8
...
我的環境規格:
Card: GeForce GTX 580
CUDA Driver Version/Runtime Version: 4.1/4.1
CUDA Capability Major/Minor version number: 2.0
任何想法我可能做錯了什麼?