-1
HY, 我有一個GPU的Tesla C2050 specificCUDA如何計算加速
我使用CUDA內核和一個串行CPU代碼至強4core。使用cpu_code時間處理是40秒。使用CUDA_kernel時,同樣的問題會在2s內處理。
我要計算的加速wiki:
CPU:S(4core)= 40/2 CUDA:S(448core)= 40/2 ?????
我很困惑,你能幫我嗎?
HY, 我有一個GPU的Tesla C2050 specificCUDA如何計算加速
我使用CUDA內核和一個串行CPU代碼至強4core。使用cpu_code時間處理是40秒。使用CUDA_kernel時,同樣的問題會在2s內處理。
我要計算的加速wiki:
CPU:S(4core)= 40/2 CUDA:S(448core)= 40/2 ?????
我很困惑,你能幫我嗎?
維基百科的文章看起來像「加速」是某種具有特定定義的科學術語。情況並非如此:)
只需通過將CPU實施時間(40s)除以GPU實施時間(2s)計算兩個實現之間的比率,並給該數字加上「x」在它後面,爲「時代」。在你的情況下,40/2 = 20x。
然後,與該數字一起提供有關硬件的詳細信息,例如CPU和GPU的類型和時鐘頻率以及CPU版本使用的內核數量等實施細節。
嗯,我們確實在科學論文中對並行處理使用了「加速」這個術語,但具體的定義與您給出的幾乎相同:最快序列算法的執行時間除以並行執行時間算法。 – reirab
我覺得維基百科文章非常正確。加速並不科學,但這種科學定義可以更好地瞭解算法的上限或下限。給出的第一個公式實際上是@RogerDahl給出的公式。您還應該檢查Amdahl's和Gustafson的定律,以便比較加速比和處理器數量和/或加速比與問題大小。 – BRabbit27