0
我試圖用CUDA確定我的PC帶寬。我有一個750M bord,我的理論帶寬是90 GB,規格中提到像80GB。我已經嘗試了nvidia網站https://devblogs.nvidia.com/parallelforall/how-implement-performance-metrics-cuda-cc/的簡單算法。 我有改變單精密度和雙精密度的代碼和我有這個結果:單精度CUDA帶寬和雙精度帶寬
單精密度(浮點):30GB/s的
雙精密度:26GB/s的
單精密度的帶寬計算如下:
printf("Effective Bandwidth (GB/s): %fn", N*4*3/milliseconds/1e6);
如果我嘗試,使之成爲雙精密度(8個字節):
printf("Effective Bandwidth (GB/s): %fn", N*8*3/milliseconds/1e6);
爲雙精密度的rezult是更大然後單精密度:
單精密度(浮點):30 GB/s的
雙精密度:45 GB/s的
謝謝。非常好的材料。 – adi94
如果這回答你的問題,也許你想標記爲這樣? –