這個問題是關於其承諾顯著改善該類型的計算OpenCL中可用的瘋狂功能:乘法和加法功能
A * B + C
如果用作狂(A,B,C )並使用cl-mad-enable進行編譯。
我已經試過了一個計算形式a + b * c + d * e使用瘋狂的一個非常巨大的大小,並期待着顯着的改善。令人驚訝的是,它花了相同的時間。
如果有人有這方面的經驗,我將不勝感激。我有一個可以工作的jist,因爲大部分資源都對mad()充滿讚美。注意:我使用的數據類型都是雙精度,如果它很重要,我對mad的使用會導致一個非常大的精度損失。
您的GPU實際上是否支持雙打?他們中的很多隻支持浮動。 – 2012-02-24 00:51:37
不是默認情況下,但通過啓用cl_khr_fp64,我可以使用它們。你可能有一點,我會轉換爲浮動和檢查。由於代碼非常大,需要一些時間。一旦我有什麼,我會迴應評論。 – 2012-02-24 08:41:08