npp

    1熱度

    1回答

    nppiGraphcut_32s8u函數對32位帶符號整數邊緣能力有效。在CUDA 6.5工具包中包含的grabCut示例中,他們只需將Npp32f轉換爲Npp32s即可。例如,從GrabcutUtil.cu在grabcutNPP例如文件夾: // Top/Bottom Npp32s bottom; bottom = _FIXED(edge_weight(center, tex2D(image

    0熱度

    1回答

    我對NPP庫有一些疑問...... 這是關於步驟在NPP參數。 當我使用NPP庫時,它讓我感到困惑。 nppiSub_32s_C1RSfs(d_sink, step, d_source, step, d_terminals, step, size, 0); 即例如.. 我可以理解,除了步驟的所有參數。每個NPP功能都需要該步驟。 一些人利用width ... 一些人利用width * sizeof

    -1熱度

    2回答

    我嘗試使用CUDA和Qt來模糊圖像。 我用NPP庫,nppiFilterGauss_8u_C1R的偉大工程 void cuda_npp_gauss_filter_qt(uchar* pSourceData, uchar* pResultData, const int &ImageLineStep, const int &ImageWidth, const int &ImageHeight) {

    0熱度

    1回答

    CUDA允許使用cuMemcpy異步函數和流重疊計算和數據傳輸。但是NPP(Performance Primitives)有可能嗎? 有點背景。我試圖利用GPU使用NPP圖像調整大小功能(在我們的例子中,它是nppiResize_8u_C3R)。我使用固定內存並使用cuMemcpy2DAsync_v2和每個線程流成功地將數據傳輸到GPU。問題是nppiResize_8u_C3R和所有其他計算功能不

    1熱度

    1回答

    我正在使用Cuda 7.5和GeForce GTX 650 Ti進行圖像處理項目。我決定使用2個數據流,一個應用負責增強圖像的算法,另一個應用另一個處理其他處理的獨立算法。 我寫了一個例子來展示我的問題。在這個例子中,我創建了一個流,然後我使用了nppSetStream。 我調用函數nppiThreshold_LTValGTVal_32f_C1R,但執行該函數時使用了2個流。 這裏有一個代碼示例:

    1熱度

    1回答

    我想用nppiFilterGauss_8u_C1R,但是當我使用CUDA-MEMCHECK,它總是報出界的,這裏是我的源代碼: Npp8u* p1 = NULL; Npp8u* p2 = NULL; unsigned char* p3 = NULL; unsigned char* p4 = NULL; int step1 = 0; int step2 = 0; NppiSize roi

    1熱度

    3回答

    我是cuda驅動程序Api接口的新手,但我認爲CUdeviceptr看起來像一個句柄參數。所以我對CUdeviceptr和npp8u *之間的轉換感到困惑。 Npp8u * src; ...... unsigned char temp; temp = src; CUdeviceptr devPtr; ....... devPtr = (CUdeviceptr)temp; 我試圖寫出

    1熱度

    1回答

    在兩個不同的體系結構(GTX480和GTX TITAN)中,使用nppiCopyConstBorder_8u_C1R函數的性能下降,也涉及到不同的CUDA版本(分別爲v5.0和v5.5)。 在第一種情況(GTX480和CUDA 5.0)的功能的執行時間是 T = 0.00005 seconds 在第二種情況下(GTX TITAN和CUDA 5.5)的執行時間是 ​​ 我用以下代碼複製了此行爲:

    0熱度

    1回答

    最後更新 CUDA NPP中值濾波:解決。 WDDM超時也是一個問題。找到了解決方案:WDDM timeout fix。謝謝羅伯特。 更新:感謝羅伯特指出,過濾器的中心不是0,0。不幸的是,如果過濾器增加了,那麼您發佈的代碼將會打破我的說法,比如17x17。這可能是由於您沒有考慮圖像「側面」的邊界。在任何情況下,這裏是最當前的代碼,但作爲前仍表現出同樣的問題... //npp #include

    0熱度

    1回答

    上述函數如何在cuda中執行操作。我們是否需要編寫CudaMalloc()或MemCopy()以及這個或者只是一個內部調用。 I「中」是具有輸入圖像和「出」載體是空載體寫 nppiResizeSqrPixel_32f_C4R(&in[0],sizeofImage,StepSize,&out[0],StepSizeOutput,DestRoi,Xfactor,YFactor,NULL,NULL,16