我想將一個物理模擬算法移植到使用OpenCL進行性能的GPU上;我沒有使用OpenCL的經驗,我正在環顧四周。計算大多是小型密集矩陣(3x3)和矢量產品,交叉產品等。opencl矩陣庫
是否有這樣的基本操作的「標準」/推薦庫?我當然不想碼矩陣乘法和反演自己(而不是時間,這將是inefficent)
隨着OpenCL的沒有類,操作符重載等,我必須寫
mmul(a,mtrans(b))
而不是a*b.transpose()
例如?是否有OpenCL(或預處理器)的某些(計劃的)擴展/演變,以使符號更像數學?我有回到長年的印象。 (我知道有CUDA,但它是供應商綁定)
對不起,我在思考lin-pack的前幾天(當時並不是我正在編程),也就是在有人做了一個很好的實現之前,而不是每個人都爲自己編寫它。通過類比,我認爲Python是一種流行語言的原因之一:「包含電池」。 – eudoxos