2013-05-18 34 views

回答

5

更新(2014年5月22日)

AMD已經產生的AMD核心數學程序庫(ACML)6.0版beta版本可以通過使用內部clMath卸載FFT和BLAS函數到GPU。公告如下:ACML Beta 6.0 Release Leverages the Power of Heterogeneous Compute。這裏需要注意的是輸入數據必須從CPU傳輸到GPU,並且輸出數據返回到的CPU,每個 BLAS或FFT調用。因此,當一個問題足夠大以至於ACML將使用GPU而不是CPU時,AMD會有一堆腳本進行調整。

爲了完整起見,我還要提到Nvidia支持與其nvBLAS庫類似的功能,但依賴於cuBLAS和CUDA,因此它不適用於除Nvidia GPU之外的任何其他功能。


原來的答覆

不幸的是,AMD的GPU加速BLAS庫不能直接鏈接到numpy的或任何其他應用程序期待一個標準的基於CPU的BLAS庫。原因是現有的GPU BLAS庫在調用BLAS函數之前都需要先將這些矩陣複製到GPU。這需要有人修改Numpy來完成這個複製。

編輯: CLyther看起來像它可以取代Numpy所做的一些操作,並將所有內容都轉換爲OpenCL。看到這裏:http://srossross.github.io/Clyther/for_numpy_users.html

0

如果內存服務器,pyCuda至少,也可能pyOpenCL可以使用numPy