Q

費米架構上的int2與int4負載

2011-05-17 15 views 1 likes

1

如果需要將兩個int2從設備內存加載到寄存器，兩個連續加載的int2與一個int4的加載相比要差多少？費米架構上的int2與int4負載

2011-05-17 artaak

+0

帶負載意味着CPU-GPU還是GPU-GPU？前者在CPU上的開銷不大（這應該不重要）。後者可能取決於你的內存訪問（合併與否）。 – 2011-05-17 21:47:43

+1

取決於卡。通常計算能力2.0+非常聰明地處理這些事情。 – 2011-05-17 22:06:55

A

回答

4

這取決於GPU和內存訪問模式。但是，假設（在問題中缺乏信息）計算能力2.0+ GPU（Fermi GPU）上的順序尋址，請參閱GTC 2010的this presentation by Paulius Micikevicius的幻燈片27.

幻燈片顯示，對於多處理器佔用率較低每個多處理器的活動線程數較低），int4可以比int2大很多。對於高入住率，幾乎沒有區別。

但是，正如幻燈片所示，「幾個獨立的較小訪問與一個較大的訪問具有相同的效果，例如：四個32位〜=一個128位」。所以，如果你需要加載的兩個int2值是獨立的，只需在代碼中一個接一個地發出這兩個加載，並且應該與執行一個int4幾乎相同的性能，假設如上所述的一致的內存訪問。

2011-05-18 03:39:45 harrism

相關問題

1. 引入nokogiri :: XML ::架構的SyntaxError上架構負載
2. 負載DDL到架構
3. GWT費用架構
4. ASCX負載與ASPX負載
5. 負載的Joomla框架
6. jQuery負載與構建元素
7. 與負載的jQuery
8. 與負載
9. 與負載
10. Linux上的HornetQ消費者高CPU負載