我是GPGPU編程新手,我正在使用OpenCL的NVIDIA實現。有多少個線程(或工作項目)可以同時運行?
我的問題是如何計算GPU設備的限制(線程數)。
從我所瞭解的情況來看,有許多工作組(相當於CUDA中的塊)包含許多工作項目(〜cuda線程)。
如何獲得目前工作組的數量我的卡上(這可以在同一時間運行)和工作項的存在於一個工作組中的號碼?
CL_DEVICE_MAX_COMPUTE_UNITS對應什麼?
核心的khronos規格說明(「OpenCL設備上的並行計算核心數量」。)與我的圖形卡規範中給出的CUDA核心有什麼區別。在我的例子中,openCL給出了14個,而我的GeForce 8800 GT則有112個基於NVIDIA網站的內核。CL_DEVICE_MAX_WORK_GROUP_SIZE(在我的情況下爲512)是否與給定特定工作組的工作項總數或工作組中可同時運行的工作項數量相對應?
任何建議將不勝感激。