0
我使用Compute Visual Profiler來測量CUDA程序的性能。Compute Visual Profiler中的CUDA memset
分析器的結果顯示了cudaMemset函數的2個不同結果。
- memset32_post
- memset128
我想知道的是這2之間的區別?
我使用Compute Visual Profiler來測量CUDA程序的性能。Compute Visual Profiler中的CUDA memset
分析器的結果顯示了cudaMemset函數的2個不同結果。
我想知道的是這2之間的區別?
我猜想,memset128內核做了大部分的工作,因爲你使用的大小不是128
的倍數memset32_post內核清理其餘的沒什麼好擔心,它只是試圖以最有效的方式實現memset,儘管我試圖避免memset在內部循環(在任何處理器上)。如果你真的擔心這個問題,你可能會超額分配。
謝謝你的回答:) – sgarizvi 2012-03-11 08:13:00