我正在進行一項比較研究,在該研究中,我必須比較算法的串行和並行版本(NSGA-II算法精確爲download link here)。 NSGA-II是一種啓發式優化方法,因此取決於所產生的最初隨機數。如果使用CPU和GPU生成的初始種羣不同,那麼我無法進行公正的加速研究。費米建築可能的解決方案,我的比較研究?
我擁有一個NVIDIA-TESLA-C1060卡,它的計算能力爲1.3。根據this anwer和this NVIDIA document,我們不能指望sm_13設備始終產生符合IEEE-754標準的float(單精度)值。換句話說,就目前的設備而言,我無法對CUDA程序進行公正的加速研究,這與對應的CUDA程序相對應。
我的問題是:切換到費米架構解決問題?
您在其他問題中獲得的信息應該足以讓您確定如何繼續。基本上,「這取決於」。 http://stackoverflow.com/questions/10334334/ieee-754-standard-on-nvidia-gpu-sm-13 – 2012-04-26 15:07:51