0
在將大型密集矩陣與其轉置相乘時使用cuBlas是否有效?具體來說,是否有任何函數利用了由此產生的矩陣是對稱的事實,因此將乘法的數量減少了〜2倍。使用cuBlas高效地將矩陣與轉置相乘
在將大型密集矩陣與其轉置相乘時使用cuBlas是否有效?具體來說,是否有任何函數利用了由此產生的矩陣是對稱的事實,因此將乘法的數量減少了〜2倍。使用cuBlas高效地將矩陣與轉置相乘
標準BLAS API ?syrk
是你所需要的。
C = alpha * A * A^T + beta * C
對於cuBlas,API名稱是cublas<t>syrk
。請參閱cuBlas文檔以獲取更多細節
http://docs.nvidia.com/cuda/cublas/index.html#cublas-lt-t-gt-syrk