cufft

0熱度

1回答

爲什麼我會在這個libcufft_static例子中得到「未定義引用__cudaRegisterLinkedBinary_60 _....`」錯誤？

我在Ubuntu 16.04上使用CUDA 7.5 SDK，通過nvidia-cuda-toolkit包安裝。我正在嘗試使用cuFFT的回調函數編譯一個簡單的測試程序;該示例的源代碼是available at GitHub。 Following the instructions for compiling with the callback feature，我編譯源爲可重定位的裝置代碼和鏈接對li

2熱度

1回答

cufftSetStream導致垃圾輸出。難道我做錯了什麼？

根據該文檔時，cufftSetStream()功能相關聯的CUDA流與CUFFT計劃。在計劃執行期間所做的所有內核啓動現在都通過關聯的流[...直到...]完成，流將通過另一次調用cufftSetStream（）進行更改。不幸的是，結果變成垃圾。下面是一個例子，它通過兩種方式執行一系列轉換來演示：一種是每個流有自己的專用計劃，另一種是單個計劃被重用，如上面的文檔所示。前者的行爲如預期，重用/

2熱度

1回答

如何：CUDA IFFT

在Matlab中，當我輸入複數的一維數組時，我輸出的數組具有相同大小和相同維數的實數。試圖在CUDA C中重複此操作，但具有不同的輸出。你能幫忙嗎？在Matlab中，當我進入IFFT（陣列）我arrayOfComplexNmbers： [4.6500 + 0.0000i 0.5964 - 1.4325i 0.4905 - 0.5637i 0.4286 - 0.2976i 0.4345 - 0

1熱度

1回答

使用cuda從複數轉換爲實數時輸出錯誤cuFFT

我正在使用cuda版本7.5 cufft來執行一些FFT和反FFT。使用cufftExecC2R(.,.)函數執行逆FFT時，我遇到了問題。其實，當我在cufftPlan1d(,)中使用batch_size = 1時，我得到了正確的結果。但是，當我增加批量大小時，結果不正確。我正在粘貼一個示例代碼來說明這一點。我很快就創建了這個代碼，請忽略代碼的髒亂。 #include <cufft.h>

0熱度

1回答

併發流中的CUDA cuFFT API行爲

對於某些圖像處理，我使用的是CUDA 7.0和nVidia 980 GTX。在特定的迭代中，通過15-20內核調用和多個cuFFT FFT/IFFT API調用獨立處理多個貼圖。由於這個原因，我已經將每個tile放置在它自己的CUDA流中，因此每個tile都相對於主機異步地執行它的操作字符串。每個tile在迭代中大小相同，因此它們共享一個cuFFT計劃。主機線程快速移動命令以嘗試使GPU加載工作。

0熱度

1回答

用於在fft/ifft調用之間的gpu內存中用於保持陣列的插槽的Anaconda包

我正在使用帶有ipython 3.6.1及其加速包的anaconda套件。在這兩個函數fft和ifft中有一個cufft子包。據我所知，這些都是一個numpy數組，輸出到一個numpy數組，在系統內存中，即所有gpu內存和系統與gpu內存之間的傳輸都會自動處理，並且在函數結束時釋放gpu內存。這似乎很好，似乎爲我工作。但是，我想在同一個數組上運行多個fft/ifft調用，並且每次從數組中提取一個數

1熱度

1回答

CUDA FFT不返回我期望的值

我目前正在調試我的代碼，我使用CUDA FFT例程。我有這樣的事情（請參閱留言給我的想法對我做什麼）： #include <cufft.h> #include <cuda.h> #include <cuda_runtime.h> #include <cuComplex.h> void foo(double* real, double* imag, size_t size) {

0熱度

1回答

在Alea的cuFFT GPU

我使用Alea GPU在使用C＃語言的GPU上進行編程。我在Visual Studio 2017項目上安裝了Alea 3.0.4，但我找不到一些cuFFT庫。在NVidia的網站上，cuFFT是CUDA工具包的一部分，因此我不需要下載其他CUDA庫。我是否需要下載一些額外的綁定，或者可以在Alea GPU上使用cuFFT？

10熱度

2回答

爲什麼cuFFT性能會受到重疊輸入的影響？

我正在嘗試使用cuFFT的回調函數來快速執行輸入格式轉換（例如，計算8位整數輸入數據的FFT，而無需首先將輸入緩衝區顯式轉換爲float）。在我的許多應用程序中，我需要計算重疊輸入緩衝區上的FFT，as described in this previous SO question。通常，相鄰的FFT可能會重疊1/4到1/8的FFT長度。 cuFFT及其類似FFTW的接口明確支持此via the i

2熱度

2回答

CUDA套箍2D示例

我目前正在研究一個必須實現2D-FFT（用於交叉關聯）的程序。我用CUDA做了一次FFT，它給了我正確的結果，我現在正在試圖實現一個2D版本。在線上很少的例子和文檔，我發現很難找出錯誤是什麼。到目前爲止，我一直只使用cuFFT手冊。無論如何，我已經創建了兩個5x5陣列，並填充1。我已經將它們複製到GPU存儲器中，並完成了前向FFT，將它們相乘，然後對結果進行ifft處理。這給了我一個值爲650