我正在使用OpenCL。我感興趣的是如何在下面的例子中執行工作項目。工作項目執行順序
我的10000與512的內核工作組大小的一維範圍是跟隨着:
__kernel void
doStreaming() {
unsigned int id = get_global_id(0);
if (!isExecutable(id))
return;
/* do some work */
}
這檢查它是否需要與以下ID或不會進行元素。
假設執行從512個大小的第一個工作組開始,其中20個被isExecutable
拒絕。 GPU是否繼續執行其他20個元素而不等第492個元素?
沒有涉及任何障礙或其他同步技術。