我的印象是,計算能力1.x GPU中的(單個)warp調度程序每4個週期發送一個指令每個warp,並且由於算術管道的延遲是24個週期,因此可以通過使用6個主動扭曲在任何時候。CUDA中的warp調度程序的指令問題時間延遲是什麼?
對於計算能力2.1GPU,編程指南提到「在每個指令發佈時間,每個調度程序發出兩條獨立的指令」,而How does the CUDA warp scheduler issue 2 instructions at a time for a warp?的帖子則建議每個調度程序每個週期可以發送一條指令每個warp。
那麼warp調度器的確切延遲是多少?每個指令每發送多少個週期?是否有不同的指令(MIMD)同時發佈到任何活動和準備好的翹曲?
這與C沒有任何關係,我會刪除標記。 – Veltas
完成刪除標記 – charis