-3
_global__ ChildKernel1(void* data){
//Operate on data
}
_global__ ChildKernel2(void* data){
//Operate on data
}
_global__ ChildKernel3(void* data){
//Operate on data
}
__global__ ParentKernel(void *data){
ChildKernel1<<<16, 2>>>(data);
ChildKernel2<<<64, 3>>>(data);
ChildKernel3<<<32, 4>>>(data);
ChildKernel4<<<16, 5>>>(data);
}
// In Host Code
ParentKernel<<<256, 64>>(data);
我想並行運行所有子內核。那麼我該怎麼做?在CUDA中並行運行多個子內核
還應該配合投票原因。 – gpuguy
我沒有downvote。問題是什麼 ?如果您可以發佈一個小型複製器並描述問題是什麼,那將會很有幫助。我假設你知道動態並行性需要CC3.5 GPU。 –
Downvote的基本原因是將鼠標懸停在downvote按鈕上。 「這個問題沒有顯示任何研究工作,但目前還不清楚......」你的問題是否顯示出研究過該主題的證據,以發現可能的答案?另外,上面的評論指出「什麼問題?」這可能是一個不明確問題的指標。 –