我正在嘗試使用OpenCL加速一些計算,部分算法由反轉矩陣組成。是否有任何開源庫或免費代碼來計算在OpenCL或CUDA中編寫的矩陣或常規反演的lu分解(lapack dgetrf和dgetri)?矩陣是真實的和方形的,但除此之外沒有任何其他特殊屬性。到目前爲止,我已經設法在gpu上找到基本的blas矩陣向量操作實現。OpenCL中的矩陣求逆
該矩陣相當小,只有大約60-100行和列,所以它可以在CPU上更快地計算,但它在算法中間使用,所以我不得不將它轉移到主機,計算反過來,然後將結果傳回設備,然後將其用於更大的計算。
您還應該注意,反轉矩陣可能是一項昂貴的操作,特別是對於大型矩陣,並且通常有其他解決手頭問題的方法。 LU分解是一個「構建塊」,可以用來避免做一個真正的逆轉。 – Tom 2010-06-01 11:53:39