cufft

    0熱度

    1回答

    我正在使用cufft實現並找不到任何對cufftcomplex函數的引用。儘管如此,我通過谷歌發現了cucomplex.h,但這並不能幫助我。具體而言,我想知道,如何讀出cufftcomplex結構的虛部和實部。

    1熱度

    1回答

    我正在使用批次cuFFT進行實驗。但我認爲我沒有得到正確的結果。 int NX = 16; // size of the array int BATCH = 16; // # of batch 我在GPU上分配兩個數組: float *src; cufftComplex *dst; cudaMalloc((void**)&src, sizeof(float)*NX*BATCH); cu

    0熱度

    1回答

    我想並行化一個聲紋指紋庫的Chromaprint FFT變換。它的工作原理是「將原始音頻分成許多重疊幀並對其應用傅立葉變換。」 Chromaprint使用4096幀大小,2/3重疊。例如,第一幀由元素[0 ... 4095]組成,則第二幀類似[1366 ... 5462]。 隨着cufftPlanMany,我知道你可以指定批量大小4096,這將批量執行[0 ... 4095],[4096 ...

    0熱度

    1回答

    所以cufftComplex類型與n結構與x和y -field,分別表示實部和各複數的虛部的陣列。 在另一方面,如果我想創建在OpenGL頂點緩衝區對象與x-和y-領域,即2D頂點或只是還表示n複數頂點緩衝區對象,我會創建一個2n浮標大小的數組具有這樣的佈局: x0 y0 | x1 y1 | ... | xn yn 我然後通過調用其寫入VBO: glBufferData(GL_ARRAY_BU

    1熱度

    1回答

    我以前幫助this答案實現就地轉換,它運作良好,但只有當我從真實的數據開始。如果我從複雜的數據開始,IFT + FFT之後的結果是錯誤的,而且這隻發生在原地版本中,我用這個變換的不合適版本得到了完美的結果。 這是代碼: #include <stdio.h> #include <stdlib.h> #include <cuda_runtime.h> #include <complex.h>

    -2熱度

    1回答

    我有這個程序有問題: #include <stdlib.h> #include <stdio.h> #include <string.h> #include <math.h> #include <cufft.h> #include <cuComplex.h> #define SIGNAL_SIZE 1024 int main(int argc, char **argv) {

    1熱度

    1回答

    第一次調用cufftPlanMany()時,大約需要0.7秒,但接下來的所有調用都很快。 任何想法如何加速第一次調用cufftPlanMany()?

    2熱度

    1回答

    什麼是使用cufftGetSize1d(或任何cufftGetSize*)函數的正確方法? 我試着用: cufftHandle plan; size_t workSize; cufftResult result; cufftCreate(&plan); result = cufftGetSize1d(plan, 1000, CUFFT_C2C, 1, &workSize); 然而,最後

    0熱度

    1回答

    我已經實現了CUDA版本的逆離散餘弦變換(IDCT),通過「翻譯」MATLAB內置函數idct.m到CUDA: 我實現cuIDCT.cu,工作時米= N兩者米和ñ是偶數。 cuIDCT.cu #include <stdio.h> #include <stdlib.h> #include <cuda.h> #include <cufft.h> #include <cuComplex.h>

    0熱度

    1回答

    我開始移植現有的fftw3應用程序以使用cuda fftw庫。最初階段是簡單地用cufft.h標題替換fftw3.h標題並鏈接標記庫而不是fftw3庫。 這很簡單,代碼編譯爲nvcc。但是,當我執行代碼時,應用程序無法使用fftw_plan_guru_dft命令創建計劃(它只返回0而不是有效的計劃)。 由於沒有錯誤報告,所以我不知道如何調試此問題。 cuda-gdb和gdb不提供任何進一步的見解。