npp

1熱度

1回答

nppiGraphcut_32s8u函數對32位帶符號整數邊緣能力有效。在CUDA 6.5工具包中包含的grabCut示例中，他們只需將Npp32f轉換爲Npp32s即可。例如，從GrabcutUtil.cu在grabcutNPP例如文件夾： // Top/Bottom Npp32s bottom; bottom = _FIXED(edge_weight(center, tex2D(image

0熱度

1回答

NPP庫中的'STEP'是什麼？

我對NPP庫有一些疑問...... 這是關於步驟在NPP參數。當我使用NPP庫時，它讓我感到困惑。 nppiSub_32s_C1RSfs(d_sink, step, d_source, step, d_terminals, step, size, 0); 即例如.. 我可以理解，除了步驟的所有參數。每個NPP功能都需要該步驟。一些人利用width ... 一些人利用width * sizeof

-1熱度

2回答

CUDA NPP GaussFilter破壞圖像

我嘗試使用CUDA和Qt來模糊圖像。我用NPP庫，nppiFilterGauss_8u_C1R的偉大工程 void cuda_npp_gauss_filter_qt(uchar* pSourceData, uchar* pResultData, const int &ImageLineStep, const int &ImageWidth, const int &ImageHeight) {

0熱度

1回答

NPP：重疊計算和數據傳輸

CUDA允許使用cuMemcpy異步函數和流重疊計算和數據傳輸。但是NPP（Performance Primitives）有可能嗎？有點背景。我試圖利用GPU使用NPP圖像調整大小功能（在我們的例子中，它是nppiResize_8u_C3R）。我使用固定內存並使用cuMemcpy2DAsync_v2和每個線程流成功地將數據傳輸到GPU。問題是nppiResize_8u_C3R和所有其他計算功能不

1熱度

1回答

Cuda，由NPP函數創建的兩個流

我正在使用Cuda 7.5和GeForce GTX 650 Ti進行圖像處理項目。我決定使用2個數據流，一個應用負責增強圖像的算法，另一個應用另一個處理其他處理的獨立算法。我寫了一個例子來展示我的問題。在這個例子中，我創建了一個流，然後我使用了nppSetStream。我調用函數nppiThreshold_LTValGTVal_32f_C1R，但執行該函數時使用了2個流。這裏有一個代碼示例：

1熱度

1回答

CUDA-MEMCHECK報告nppiFilterGauss_8u_C1R出界

我想用nppiFilterGauss_8u_C1R，但是當我使用CUDA-MEMCHECK，它總是報出界的，這裏是我的源代碼： Npp8u* p1 = NULL; Npp8u* p2 = NULL; unsigned char* p3 = NULL; unsigned char* p4 = NULL; int step1 = 0; int step2 = 0; NppiSize roi

1熱度

3回答

如何將Npp8u *轉換爲CUdeviceptr

我是cuda驅動程序Api接口的新手，但我認爲CUdeviceptr看起來像一個句柄參數。所以我對CUdeviceptr和npp8u *之間的轉換感到困惑。 Npp8u * src; ...... unsigned char temp; temp = src; CUdeviceptr devPtr; ....... devPtr = (CUdeviceptr)temp; 我試圖寫出

1熱度

1回答

性能下降nppiCopyConstBorder_8u_C1R

在兩個不同的體系結構（GTX480和GTX TITAN）中，使用nppiCopyConstBorder_8u_C1R函數的性能下降，也涉及到不同的CUDA版本（分別爲v5.0和v5.5）。在第一種情況（GTX480和CUDA 5.0）的功能的執行時間是 T = 0.00005 seconds 在第二種情況下（GTX TITAN和CUDA 5.5）的執行時間是我用以下代碼複製了此行爲：

0熱度

1回答

16個圖像

最後更新 CUDA NPP中值濾波：解決。 WDDM超時也是一個問題。找到了解決方案：WDDM timeout fix。謝謝羅伯特。更新：感謝羅伯特指出，過濾器的中心不是0,0。不幸的是，如果過濾器增加了，那麼您發佈的代碼將會打破我的說法，比如17x17。這可能是由於您沒有考慮圖像「側面」的邊界。在任何情況下，這裏是最當前的代碼，但作爲前仍表現出同樣的問題... //npp #include

0熱度

1回答

nppiResizeSqrPixel_32f_C4R（）如何工作？

上述函數如何在cuda中執行操作。我們是否需要編寫CudaMalloc（）或MemCopy（）以及這個或者只是一個內部調用。 I「中」是具有輸入圖像和「出」載體是空載體寫 nppiResizeSqrPixel_32f_C4R(&in[0],sizeofImage,StepSize,&out[0],StepSizeOutput,DestRoi,Xfactor,YFactor,NULL,NULL,16