cufft

    0熱度

    1回答

    我在Ubuntu 16.04上使用CUDA 7.5 SDK,通過nvidia-cuda-toolkit包安裝。我正在嘗試使用cuFFT的回調函數編譯一個簡單的測試程序;該示例的源代碼是available at GitHub。 Following the instructions for compiling with the callback feature,我編譯源爲可重定位的裝置代碼和鏈接對li

    2熱度

    1回答

    根據該文檔時,cufftSetStream()功能 相關聯的CUDA流與CUFFT計劃。在計劃執行期間所做的所有內核啓動現在都通過關聯的流[...直到...]完成,流將通過另一次調用cufftSetStream()進行更改。 不幸的是,結果變成垃圾。下面是一個例子,它通過兩種方式執行一系列轉換來演示:一種是每個流有自己的專用計劃,另一種是單個計劃被重用,如上面的文檔所示。前者的行爲如預期,重用/

    2熱度

    1回答

    在Matlab中,當我輸入複數的一維數組時,我輸出的數組具有相同大小和相同維數的實數。 試圖在CUDA C中重複此操作,但具有不同的輸出。 你能幫忙嗎?在Matlab中,當我進入IFFT(陣列) 我arrayOfComplexNmbers: [4.6500 + 0.0000i 0.5964 - 1.4325i 0.4905 - 0.5637i 0.4286 - 0.2976i 0.4345 - 0

    1熱度

    1回答

    我正在使用cuda版本7.5 cufft來執行一些FFT和反FFT。 使用cufftExecC2R(.,.)函數執行逆FFT時,我遇到了問題。 其實,當我在cufftPlan1d(,)中使用batch_size = 1時,我得到了正確的結果。但是,當我增加批量大小時,結果不正確。 我正在粘貼一個示例代碼來說明這一點。我很快就創建了這個代碼,請忽略代碼的髒亂。 #include <cufft.h>

    0熱度

    1回答

    對於某些圖像處理,我使用的是CUDA 7.0和nVidia 980 GTX。在特定的迭代中,通過15-20內核調用和多個cuFFT FFT/IFFT API調用獨立處理多個貼圖。由於這個原因,我已經將每個tile放置在它自己的CUDA流中,因此每個tile都相對於主機異步地執行它的操作字符串。每個tile在迭代中大小相同,因此它們共享一個cuFFT計劃。主機線程快速移動命令以嘗試使GPU加載工作。

    0熱度

    1回答

    我正在使用帶有ipython 3.6.1及其加速包的anaconda套件。在這兩個函數fft和ifft中有一個cufft子包。據我所知,這些都是一個numpy數組,輸出到一個numpy數組,在系統內存中,即所有gpu內存和系統與gpu內存之間的傳輸都會自動處理,並且在函數結束時釋放gpu內存。這似乎很好,似乎爲我工作。但是,我想在同一個數組上運行多個fft/ifft調用,並且每次從數組中提取一個數

    1熱度

    1回答

    我目前正在調試我的代碼,我使用CUDA FFT例程。 我有這樣的事情(請參閱留言給我的想法對我做什麼): #include <cufft.h> #include <cuda.h> #include <cuda_runtime.h> #include <cuComplex.h> void foo(double* real, double* imag, size_t size) {

    0熱度

    1回答

    我使用Alea GPU在使用C#語言的GPU上進行編程。我在Visual Studio 2017項目上安裝了Alea 3.0.4,但我找不到一些cuFFT庫。在NVidia的網站上,cuFFT是CUDA工具包的一部分,因此我不需要下載其他CUDA庫。我是否需要下載一些額外的綁定,或者可以在Alea GPU上使用cuFFT?

    10熱度

    2回答

    我正在嘗試使用cuFFT的回調函數來快速執行輸入格式轉換(例如,計算8位整數輸入數據的FFT,而無需首先將輸入緩衝區顯式轉換爲float)。在我的許多應用程序中,我需要計算重疊輸入緩衝區上的FFT,as described in this previous SO question。通常,相鄰的FFT可能會重疊1/4到1/8的FFT長度。 cuFFT及其類似FFTW的接口明確支持此via the i

    2熱度

    2回答

    我目前正在研究一個必須實現2D-FFT(用於交叉關聯)的程序。我用CUDA做了一次FFT,它給了我正確的結果,我現在正在試圖實現一個2D版本。在線上很少的例子和文檔,我發現很難找出錯誤是什麼。 到目前爲止,我一直只使用cuFFT手冊。 無論如何,我已經創建了兩個5x5陣列,並填充1。我已經將它們複製到GPU存儲器中,並完成了前向FFT,將它們相乘,然後對結果進行ifft處理。這給了我一個值爲650