2
我使用的HD5770有10個計算單元和32k的本地內存。本地記憶,我是否假設正確的概念?
我的全球尺寸爲256 * 256,
我的本地大小爲256
的工作組中的每一個需要使用的本地存儲器,我指定這樣的1K:
clSetKernelArg(predicate, param++, 1024, NULL);
第一:這是分配本地內存的正確方法,還是必須指定所有工作組使用的緩衝區的整個大小,在設置內核arg時以及稍後根據本地ID在此緩衝區中設置索引時?
第二個:一個工作組是否只能在一個計算單元上執行?
第三項:工作組結束後會釋放內存嗎? (32K不會夠256個工作組,如果他們每個人的使用1K)
或者更一般的方式:將調度拿不出調度並聯超過32個工作組的照顧?
謝謝!
感謝您的回覆,但我如何知道同時有多少工作組會被激活?在這種情況下,超過32個不會同時執行 – Simbi 2013-02-17 12:59:27
@ user984308,但無法知道真的,理論上工作組可以獨立運行。 OpenCL標準沒有指定執行模型如何映射到硬件上。 – 2013-02-17 14:27:10