opencl

    2熱度

    3回答

    我對OpenCL相當陌生,請耐心等待。 在我的代碼的第一次迭代中,我使用了大型數據集的基本內存緩衝區並將它們聲明爲全局的。但是現在我正在尋找改進時機,我想爲此使用紋理內存。在CUDA版本中,我們使用cudaBindTexture和tex1Dfetch來獲取大型1D浮點數組的數據。根據我對規範的理解,紋理內存與圖像內存是一樣的。但是,由於只有最大高度和寬度的2D和3D圖像對象,所以我遇到了一些問題。

    6熱度

    3回答

    我最近開始學習如何使用openCL來加速我的部分代碼。迄今爲止,速度增益令人印象深刻。在一種情況下,代碼的運行速度比在CPU上快50倍。不過,我想知道是否可以開始在生產環境中使用此代碼。原因是,我第一次嘗試運行示例代碼,沒有任何工作。我可以通過在Nvidia openCL SDK下載頁面下載驅動程序來運行它(我有一個Geforce GTX260)。它在安裝過程中給了我一個藍色,但之後我能夠運行示例

    12熱度

    2回答

    我在思考如何處理基元,如FFT,卷積,相關,矩陣數學,任何類型的機器視覺基元。我並不是 能夠找到任何東西,有沒有人知道任何好的項目已經出現了?

    41熱度

    8回答

    我正在使用OpenCL。有誰知道OpenCL的良好調試器,這樣我就可以進入OpenCL代碼並跟蹤了嗎?

    10熱度

    9回答

    當我在控制檯登錄時,我的OpenCL程序可以找到GPU設備,但是當我使用ssh遠程登錄時,無法找到GPU設備。此外,如果我在ssh會話中以root身份運行程序,程序可以找到GPU。 該電腦是一款帶有GeForce 9400 GPU的Snow Leopard Mac。 如果我從控制檯或以root身份運行的程序(見下文),輸出如下(注意「的GeForce 9400」線): 2 devices foun

    4熱度

    2回答

    如果我有這樣的: err = clEnqueueReadBuffer(cmdQueue, output, CL_TRUE, 0, sizeof(float) * data_sz, &results, 0, NULL, NULL); 我想要做的: if (err != CL_SUCCESS){ perror("Read Failed!"); } 但錯誤常量像 「CL_HOST_O

    10熱度

    4回答

    是否可以在OpenCL內核中使用類似於gmp類型(mpz_t,mpq_t,...)的自定義類型?通過添加不同的參數來第四個參數的clBuildProgram(選項) #include <gmp.h> __kernel square( __global mpz_t* input, __global mpz_t number, __global int* output

    8熱度

    6回答

    我剛剛開始學習OpenCL。我試圖感受當將函數/算法移動到GPU時性能提升的預期。 在大多數教程中給出的最基本的內核是內核,它需要兩個數字陣列,並在對應的索引求和值,並將它們添加到第三陣列,像這樣:我假設 __kernel void add(__global float *a, __global float *b, __global float *answer) {

    0熱度

    1回答

    我目前正在使用NVIDIA Tesla C1060(驅動程序版本195.17)上的OpenCL項目。不過,我收到了一些我無法解釋的奇怪行爲。這裏是一個困擾我的代碼(減少清晰度和測試目的): kernel void TestKernel(global const int* groupOffsets, global float* result, local int* tmpD

    3熱度

    3回答

    Mac OS X 10.6附帶OpenCL,但如果將重寫爲使用OpenCL,有多少應用程序可以獲得更好的性能?什麼樣的應用程序應該重寫爲使用OpenCL?