預測/計算CUDA內核性能的程度如何?您能預測CUDA內核的運行時間嗎?
在CUDA上工作了一番之後,這似乎並不重要。
但是我的一位不在CUDA工作的同事告訴我,如果您擁有內存帶寬,處理器數量和速度,這不是一件難事嗎?
他說的話似乎與我讀的不一致。這是我能想象得到的。你怎麼看?
Memory processed
------------------ = runtime for memory bound kernels ?
Memory bandwidth
或
Flops
------------ = runtime for computation bound kernels?
Max GFlops
同意,理論最高性能的百分比是你可以做的最好的。 – ArchaeaSoftware