opencl

    3熱度

    2回答

    我構建了我自己的小Opencl示例,使用不同的網絡資源。實際的內核工作,我得到我想要的輸出,但我在其中一個例子中發現的清理函數會導致段錯誤。我做錯了什麼? #include <stdio.h> #include <stdlib.h> #include <errno.h> #include <CL/cl.h> //opencl #define CL_CHECK(_expr)

    5熱度

    1回答

    我想在我的OpenCL內核中使用#include語句,但它出現Apple的OpenCL編譯器緩存內核,所以如果您更改包含文件的內容但不更改包含文件的內容,程序將不會在運行之間更改。 我已經編寫了其說明了這一個例子: http://github.com/enjalot/adventures_in_opencl/tree/master/experiments/inc/ 如果你編譯並運行,它應該工作的罰

    3熱度

    1回答

    在我的最後一個問題OpenCl cleanup causes segfault.中,有人暗示缺少事件處理,即不等待代碼完成,可能會導致seg故障。從那以後,我再次查看了我使用的教程,但他們沒有注意事件(Matrix Multiplication 1 (OpenCL)和NVIDIA_OpenCL_GettingStartedLinux.pdf)或者詳細討論它(對我來說)可以理解。 你知道OpenCL

    5熱度

    2回答

    我正在計算使用OpenCL的n維點之間的歐幾里德距離。我得到了兩個n維點的列表,我應該返回一個數組,其中只包含第一個表中每個點到第二個表中每個點的距離。 我的做法是做正規多布爾循環(在表1的每一個點{於表2 {每一點...}},然後做使用並聯每對點的計算。 的歐幾里得然後將距離分爲3部分: 1.取點 中的每個尺寸之差2.平方差(仍針對每個尺寸) 3.將所有在2中獲得的值相加。 4.取平方根的值(在

    0熱度

    1回答

    的OpenCL沒有一個全球性的屏障,將停止所有線程,所以我試圖圍繞創建工作與下面的代碼: void barrier(__global uint* scratch) { uint nThreads = get_global_size(0); atom_inc(scratch); /* this loop never terminates */ while(sc

    13熱度

    5回答

    我在教程中看到了這兩個版本,但我找不到它們的優點和缺點。哪一個是正確的? cl_mem input = clCreateBuffer(context,CL_MEM_READ_ONLY,sizeof(float) * DATA_SIZE, NULL, NULL); clEnqueueWriteBuffer(command_queue, input, CL_TRUE, 0, sizeof(float

    16熱度

    3回答

    有一件事我沒有想出來,谷歌沒有幫助我,爲什麼有可能銀行與共享內存衝突,但不是在全球內存?銀行可以與寄存器衝突嗎? UPDATE 哇我真的很感謝Tibbit和灰熊的兩個答案。看來,我只能給一個綠色的複選標記一個答案,但。我對堆棧溢出很陌生。我想我必須選擇一個最好的答案。我可以做些什麼來表達謝意,我不給綠色檢查的答案嗎?

    1熱度

    1回答

    我正在使用Compute Prof 3.2和Geforce GTX 280.我有計算能力1.3,我相信。 This file,似乎表明我應該能夠看到這些字段,因爲我使用的是1.x計算設備。那麼我沒有看到它們,用戶指南3.2工具包說我看不到它們,但稱它們爲gst_uncoalesced和gst_coalesced。總結起來,如果我正在從全局內存中進行非合併讀取,我對如何從分析器中找出問題感到困惑。看

    1熱度

    1回答

    我一直有一個艱難的時間建立一個實驗,我和CUDA設備上分配內存,採取指針存儲在設備上,在OpenCL中使用它,返回結果。我想看看這是否可能。我很難讓CUDA項目工作,所以我只在他們的SDK中使用了Nvidia的模板項目。在生成文件中,我將-lOpenCL添加到common.mk的libs部分。當我這樣做的時候一切都很好,但是當我將#include <CL/cl.h>添加到template.cu中時

    2熱度

    2回答

    我知道OpenCL支持內聯函數,但這些函數可以接受並返回OpenCL類型嗎? 具體地說,我感興趣的東西與此簽名: 個float4 FUNC(float4變量X,float4變量Y)