-1
你有耐心回答新手嗎?對2D圖像的CUDA卷積的快速/簡單應用?
(我改寫基於答覆這個問題。)
我需要在許多2K x 2K分辨率的圖像(浮動)進行卷積內核(16×16浮動)。有沒有在cuBLAS或cuFFT(cuFFT我假設我必須首先將圖像和內核轉換爲傅立葉空間)的東西? (讓我們假設我不能使用openCV或NPP,除非它是複製源代碼)。
哪個選項,你將需要:
- 使用CUFFT並轉換圖像和內核傅立葉空間,過濾器,然後逆FFT?
- 沿着我自己的NVIDA SDK和:https://www.evl.uic.edu/sjames/cs525/final.html
- 看看做一個盒子過濾器,並使用積分(和圖像)。
正如你的鏈接中指出的那樣,nvidia可分卷積樣本代碼非常快,並且[包括白皮書](http://docs.nvidia.com/cuda/cuda-samples/index.html#cuda-separable -卷積) – 2015-01-09 19:24:03