2015-04-29 43 views
1

我正在學習cuda。有可能加速與紋理內存的矩陣乘法?

是否有可能加速一些簡單的矩陣乘法與紋理內存?除了我的平鋪之外,空間位置是一個很好的屬性,但是使用紋理內存的開銷會超過它嗎?

我似乎無法找到任何使用紋理內存的矩陣乘法的實現。

+0

對您來說,查看此[SO線程](http://stackoverflow.com/q/25821131/3242721)可能會有幫助。 –

+0

謝謝。這確實是一個好主意。但是我對這個特殊任務仍然不確定,所以如果以前沒有人做過,我會在幾天內回答自己。 – trainset

回答

2

矩陣乘法可以以各種方式實現。

與僅使用全局內存的矩陣乘法的天真實現相比,是的,可以使用紋理內存加速它。

與使用共享內存的更好的矩陣乘法版本相比,紋理內存不太可能帶來太多或任何好處。

如果要從CUDA矩陣乘法中獲得最佳性能,應該使用CUBLAS。不要編寫自己的矩陣乘法碼。