我在理解GPU上的SIMT執行時遇到了一些問題。到目前爲止,我已經將這些線程放置在「warps」(例如32個線程/ warp)中。這些線程將是相同的類型,並可以並行運行(但可以獨立運行,支持&)。SIMT扭曲問題
我正在閱讀的書然後繼續混淆我。 'It is then up to the instruction unit to select warps that are ready to execute their next instruction, and this instruction is then issued to the active threads of the warp. Each SP core executes an instruction for four individual threads of a warp using four clocks'.
選擇的架構有8個SP,每個warp有32個線程。因此每個SP分配4個線程。爲什麼不分配1個線程/ SP? 「使用四個鐘錶」是什麼意思?每條指令是否需要1個時鐘,並執行4次(每個線程1個)?
我的另一個問題是如果你有一個32線程的warp每個包含一個條件。如果半分支一路和另一半?從我讀過的內容來看,線程執行兩個結果?這個怎麼用?即它如何遵守程序規則