0
我試圖實現像cublas<>gemmBatched
scipy.sparse.bsr_matrix操作的東西。不幸的是我不能用cusparse來做這件事,因爲我的BSR矩陣不是方形的。cublas <> gemmBabched與別名Carray參數
我是新來的CUBLAS,我不知道它是否OK(正確明智和性能明智)使用別名指針(如pointer aliasing)陣列float * Carray[]
例如
/* given float * out as the real output array */
float * Carray[] = {
out + 1*stride, out + 2*stride, out + 3*stride,
out + 1*stride, out + 2*stride, out + 3*stride,
/* and repeat */
};
而且,雖然我敢肯定,這將是正確的,如果我使用別名Aarray
或Barray
,沒有任何性能影響?
謝謝!