2017-04-11 26 views
0

上述函數如何在cuda中執行操作。我們是否需要編寫CudaMalloc()或MemCopy()以及這個或者只是一個內部調用。nppiResizeSqrPixel_32f_C4R()如何工作?

I「中」是具有輸入圖像和「出」載體是空載體寫

nppiResizeSqrPixel_32f_C4R(&in[0],sizeofImage,StepSize,&out[0],StepSizeOutput,DestRoi,Xfactor,YFactor,NULL,NULL,16); 

這裏。但執行上述功能後,輸出矢量仍爲'0'。你能指導我如何調整功能。

回答

2

它運行在設備中的數據,所以你需要使用設備分配(如cudaMalloc)和數據複製到設備(例如cudaMemcpy)等

用於核電站調用文檔數量有限的可在usual place,並有CUDA sample codes演示npp庫調用利用率的一些示例。

對於這些資源無法解決的問題,您可能還需要查看intel ipp文檔。 npp例程在很多情況下都非常模仿intel ipp的功能,所以你可能會在那裏得到一些見解。 Here是一個示例文檔。

還要檢查任何適當的CUDA或npp調用的返回值,並且您還可以使用cuda-memcheck運行您的代碼以獲得有關可能出錯的提示。