2015-01-09 84 views
-1

你有耐心回答新手嗎?對2D圖像的CUDA卷積的快速/簡單應用?

(我改寫基於答覆這個問題。)

我需要在許多2K x 2K分辨率的圖像(浮動)進行卷積內核(16×16浮動)。有沒有在cuBLAS或cuFFT(cuFFT我假設我必須首先將圖像和內核轉換爲傅立葉空間)的東西? (讓我們假設我不能使用openCV或NPP,除非它是複製源代碼)。

哪個選項,你將需要:

  1. 使用CUFFT並轉換圖像和內核傅立葉空間,過濾器,然後逆FFT?
  2. 沿着我自己的NVIDA SDK和:https://www.evl.uic.edu/sjames/cs525/final.html
  3. 看看做一個盒子過濾器,並使用積分(和圖像)。
+0

正如你的鏈接中指出的那樣,nvidia可分卷積樣本代碼非常快,並且[包括白皮書](http://docs.nvidia.com/cuda/cuda-samples/index.html#cuda-separable -卷積) – 2015-01-09 19:24:03

回答

0

我能夠實現算法,使用UIUC學生的論文和Nvidia的白皮書。謝謝羅伯特。