1
我正在學習cuda。有可能加速與紋理內存的矩陣乘法?
是否有可能加速一些簡單的矩陣乘法與紋理內存?除了我的平鋪之外,空間位置是一個很好的屬性,但是使用紋理內存的開銷會超過它嗎?
我似乎無法找到任何使用紋理內存的矩陣乘法的實現。
我正在學習cuda。有可能加速與紋理內存的矩陣乘法?
是否有可能加速一些簡單的矩陣乘法與紋理內存?除了我的平鋪之外,空間位置是一個很好的屬性,但是使用紋理內存的開銷會超過它嗎?
我似乎無法找到任何使用紋理內存的矩陣乘法的實現。
矩陣乘法可以以各種方式實現。
與僅使用全局內存的矩陣乘法的天真實現相比,是的,可以使用紋理內存加速它。
與使用共享內存的更好的矩陣乘法版本相比,紋理內存不太可能帶來太多或任何好處。
如果要從CUDA矩陣乘法中獲得最佳性能,應該使用CUBLAS。不要編寫自己的矩陣乘法碼。
對您來說,查看此[SO線程](http://stackoverflow.com/q/25821131/3242721)可能會有幫助。 –
謝謝。這確實是一個好主意。但是我對這個特殊任務仍然不確定,所以如果以前沒有人做過,我會在幾天內回答自己。 – trainset