kepler

    2熱度

    3回答

    開普勒的dynamic parallelism很少有關於這項新技術的描述,這是否意味着在同一個warp中線程控制流散度問題得到了解決? 它允許recursion和從設備代碼執行內核,這是否意味着可以同時執行不同線程中的控制路徑?

    3熱度

    1回答

    運行我的應用程序時,第一個cuda_malloc需要40秒,這是由於GPU的初始化。當我在調試模式下構建時,這會減少到5秒,而當我在Fermi器件上運行相同的代碼時,所花的時間會少於一秒(在我的情況下,甚至不需要測量)。 現在有趣的是,如果我爲這個特定的架構編譯,使用sm35而不是sm20標誌,它會再次變得很快。由於我現在還不應該使用任何新的sm35功能,我如何編譯sm20並且不會有這麼大的延遲?

    0熱度

    1回答

    正如我們所知道的費米只支持到GPU單一連接,併爲這裏寫的:http://on-demand.gputechconf.com/gtc-express/2011/presentations/StreamsAndConcurrencyWebinar.pdf Fermi架構可同時支持 多達16個CUDA內核的GPU 當我們瞭解Hyper-Q允許來自多個CUDA流,MPI進程或進程內多個線程的多達32個同時

    0熱度

    2回答

    所有開普勒RCP應用上的coolbars看起來都很糟糕。這是一個在Windows 8上從頭開始創建的項目。 這是什麼感覺酷酷的黑色線條圍繞酷吧? 它可以用CSS進行樣式破解嗎? 從我的測試中,似乎只有當透視條出現時纔會出現。

    0熱度

    1回答

    我碰到過這個文檔 cuobjdump.pdf。 它列出了費米和開普勒指令,但沒有額外的解釋。 除了通常的加,減,乘等等,我沒有得到其他指令的意思或做什麼。任何人都可以幫我解決這個問題,或者指向一個解釋他們的文檔或鏈接?