我在使用JCUDA時遇到了麻煩。我有一個任務是使用CUFFT庫進行一維FFT,但結果應該是乘以2.所以我決定用CUFFT_R2C進行一維FFT。負責此類操作的類: public class FFTTransformer {
private Pointer inputDataPointer;
private Pointer outputDataPointer;
p
我一直在嘗試在矩陣乘法中使用jcuda中的cublasSgemmBatched()函數,我不確定如何正確處理批處理矩陣的指針傳遞和向量。如果有人知道如何修改我的代碼以正確處理這個問題,我會非常感激。在這個例子中,C數組在cublasGetVector後保持不變。 public static void SsmmBatchJCublas(int m, int n, int k, float A[],
我有一百萬列x一百萬行的矩陣。 我algoritm需要做的: Matrix m = Matrix(rows,cols)
for (colB: cols){
vector currColA = m.getcolumn(colA)
for (colB: cols){
vector currColB = m.getcolumn(colB)
result = c