opencl

    1熱度

    1回答

    我說得對,從1.1的OpenCL標準(部分10年6月11日)以下的報價 事件參數也可以用來調用將 async_work_group_copy與之前的異步副本相關聯允許多個異步副本共享 的事件; 意味着我可以「組」幾個async_work_group_copy()電話與一個單一的事件和只使用該事件等待整個羣組複製操作完成的? 備註:看來,在博客帖子下面的代碼片段爲using_local()內核做到這

    1熱度

    1回答

    我在OpenCL的內核下面的代碼: char* read_data(char* data) { return data; } __kernel void some_function(__global char* source_data, __global char* output_data) { char *ptr = read_data(source_data); //

    0熱度

    1回答

    我嘗試編譯下面的代碼,既要靜態庫和目標文件: Halide::Func f("f"); Halide::Var x("x"); f(x) = x; f.gpu_tile(x, 4); f.bound(x, 0, 16); Halide::Target target = Halide::get_target_from_environment(); target.set_feature

    0熱度

    2回答

    我寫了一個簡單的OpenCL程序,其目標是使用OpenCL image2d結構複製輸入圖像。這似乎是一個簡單的工作,但我一直堅持下去。 內核具有總是返回零值的「read_imageui」。輸入圖像是全白色的jpeg圖像。 使用OpenCV imread完成圖像加載。 這裏是內核: const sampler_t smp = CLK_NORMALIZED_COORDS_FALSE | CLK_ADD

    1熱度

    1回答

    我會提前警告你我寫的英文不好,請耐心等待,因爲我會犯很多錯誤。 我需要揭示圖形卡,以便在有限元分析中使用並行算法進行一些基準測試。我在這個鏈接https://software.intel.com/en-us/intel-opencl下載了intel sdk。 我使用的是Ubuntu 16.10,所以我按照這篇文章https://streamcomputing.eu/blog/2011-06-24/

    3熱度

    1回答

    假設我使用clEnqueueWriteBuffer將數據複製到設備,並且假設數據是RGB值(unsigned char s)的緩衝區。我想先通過操作輸入緩衝區(例如通過覆蓋R組件)來將圖像轉換爲灰度,然後我想將生成的圖像調整爲輸出緩衝區。然後我會使用clEnqueueReadBuffer將輸出複製回主機內存。由於我不能編寫一個包含所有邏輯的單個內核(因爲OpenCL處理的內在無序性),所以我在考慮

    -1熱度

    1回答

    你知道OpenCV庫中的Mali OpenCL SDK和OpenCL有什麼不同嗎?我發現在Mali OpenCL SDK中有一些關於如何創建內存緩衝區,獲取輸入數據,設置參數的詳細示例代碼......但是在OpenCL內部的OpenCV庫中,我只需要將Mat從更改爲UMAT以使OpenCL代碼在GPU上運行?它似乎隱藏在API下的OpenCL代碼?我如何通過我的應用程序更改OpenCL代碼?

    0熱度

    1回答

    我想在opencl中使用uint8_t數據類型。我剛剛宣佈檢查它是否被支持,但是它提供了有關stdint.h的一些錯誤。當運行編譯.CL代碼,並得到這個錯誤 Compilation started In file included from 1:1: In file included from /usr/include/stdint.h:25: In file included from /usr

    0熱度

    1回答

    我需要實現針對版本1.2我的開放源代碼項目,一個真正的工作平臺版本過濾器: https://github.com/tugrul512bit/Cekirdekler 我沒有$ 150購買一個OpenCL2.0的顯卡現在這樣我正在研究一個純粹的1.2版本系統,並不確定其他(新)系統。 問:怎樣的平臺的列表看起來當只有OpenCL的2.0的GPU和兩個1.2(max)和2.0(最大)的GPU存在於同一個

    2熱度

    1回答

    我正在優化pyOpenCL中的Mandelbrot渲染器,並希望將塊中的迭代拆分,以便更好地利用我的GPU。 最大迭代次數= 1000和2個「塊」的示例: 1.運行mandelbrot轉義算法以進行迭代0-500。 2.保存每一點所需要的迭代,其中迭代< 500和所有其他點與500迭代再次運行 - 1000 第一循環的工作原理是預期,但之後每塊會導致錯誤的結果。我真的想更具體,但我不知道真正的問題