cufft

0熱度

1回答

我正在使用cufft實現並找不到任何對cufftcomplex函數的引用。儘管如此，我通過谷歌發現了cucomplex.h，但這並不能幫助我。具體而言，我想知道，如何讀出cufftcomplex結構的虛部和實部。

1熱度

1回答

我正在使用批次cuFFT進行實驗。但我認爲我沒有得到正確的結果。 int NX = 16; // size of the array int BATCH = 16; // # of batch 我在GPU上分配兩個數組： float *src; cufftComplex *dst; cudaMalloc((void**)&src, sizeof(float)*NX*BATCH); cu

0熱度

1回答

是否有可能將批量FFT與CUDA的cuFFT庫和cufftPlanMany重疊？

我想並行化一個聲紋指紋庫的Chromaprint FFT變換。它的工作原理是「將原始音頻分成許多重疊幀並對其應用傅立葉變換。」 Chromaprint使用4096幀大小，2/3重疊。例如，第一幀由元素[0 ... 4095]組成，則第二幀類似[1366 ... 5462]。隨着cufftPlanMany，我知道你可以指定批量大小4096，這將批量執行[0 ... 4095]，[4096 ...

0熱度

1回答

應用CUFFT到OpenGL的頂點緩衝對象

所以cufftComplex類型與n結構與x和y -field，分別表示實部和各複數的虛部的陣列。在另一方面，如果我想創建在OpenGL頂點緩衝區對象與x-和y-領域，即2D頂點或只是還表示n複數頂點緩衝區對象，我會創建一個2n浮標大小的數組具有這樣的佈局： x0 y0 | x1 y1 | ... | xn yn 我然後通過調用其寫入VBO： glBufferData(GL_ARRAY_BU

1熱度

1回答

cuFFT錯誤的結果只有當從複雜的開始

我以前幫助this答案實現就地轉換，它運作良好，但只有當我從真實的數據開始。如果我從複雜的數據開始，IFT + FFT之後的結果是錯誤的，而且這隻發生在原地版本中，我用這個變換的不合適版本得到了完美的結果。這是代碼： #include <stdio.h> #include <stdlib.h> #include <cuda_runtime.h> #include <complex.h>

-2熱度

1回答

CUFFT輸出不正確

我有這個程序有問題： #include <stdlib.h> #include <stdio.h> #include <string.h> #include <math.h> #include <cufft.h> #include <cuComplex.h> #define SIGNAL_SIZE 1024 int main(int argc, char **argv) {

1熱度

1回答

爲什麼cufftPlanMany（）需要太長時間？

第一次調用cufftPlanMany（）時，大約需要0.7秒，但接下來的所有調用都很快。任何想法如何加速第一次調用cufftPlanMany（）？

2熱度

1回答

CUFFT_INVALID_VALUE in cufftGetSize1d

什麼是使用cufftGetSize1d（或任何cufftGetSize*）函數的正確方法？我試着用： cufftHandle plan; size_t workSize; cufftResult result; cufftCreate(&plan); result = cufftGetSize1d(plan, 1000, CUFFT_C2C, 1, &workSize); 然而，最後

0熱度

1回答

自我實現的cuIDFT.cu的遞歸使用導致每次重新運行代碼時改變輸出

我已經實現了CUDA版本的逆離散餘弦變換（IDCT），通過「翻譯」MATLAB內置函數idct.m到CUDA：我實現cuIDCT.cu，工作時米= N兩者米和ñ是偶數。 cuIDCT.cu #include <stdio.h> #include <stdlib.h> #include <cuda.h> #include <cufft.h> #include <cuComplex.h>

0熱度

1回答

調試CUFFTW接口計劃創建

我開始移植現有的fftw3應用程序以使用cuda fftw庫。最初階段是簡單地用cufft.h標題替換fftw3.h標題並鏈接標記庫而不是fftw3庫。這很簡單，代碼編譯爲nvcc。但是，當我執行代碼時，應用程序無法使用fftw_plan_guru_dft命令創建計劃（它只返回0而不是有效的計劃）。由於沒有錯誤報告，所以我不知道如何調試此問題。 cuda-gdb和gdb不提供任何進一步的見解。