我想闡述一個關於Nvidia顯卡計算能力的理論問題。 從我相對較短的經驗來看,我注意到使用CC 2.0的卡可以執行比1.3更好的卡。這可能真的取決於內核的性質以及每個SM將使用的佔用情況。cuda啓用nvidia GPU的比較
但是因爲一切都有其優點和缺點,2.0卡有什麼缺點和1.3的優點?
1.3卡可以如何比2.0更快地執行某個內核以及該內核具有哪些特性。
任何個人經驗都很受歡迎,如果通過每張卡的架構有更完整的解讀,甚至更好。
Regards
我想闡述一個關於Nvidia顯卡計算能力的理論問題。 從我相對較短的經驗來看,我注意到使用CC 2.0的卡可以執行比1.3更好的卡。這可能真的取決於內核的性質以及每個SM將使用的佔用情況。cuda啓用nvidia GPU的比較
但是因爲一切都有其優點和缺點,2.0卡有什麼缺點和1.3的優點?
1.3卡可以如何比2.0更快地執行某個內核以及該內核具有哪些特性。
任何個人經驗都很受歡迎,如果通過每張卡的架構有更完整的解讀,甚至更好。
Regards
一般來說,計算能力越高,GPU的能力就越強。 Check out Wikipedia
當然,如果你寫了與3.5的CC和偉大的代碼或2.0的GPU CC一個GPU糟糕的代碼,2.0 GPU 可以跑贏大盤3.5 GPU。
我正在談論在1.3和2.0上運行的同一段代碼(不是網格的大小)。內核的特性應該是什麼,從而在1.3上執行得更快。 – user1280671 2013-04-23 15:19:50
這是不可能的。在所有參數中2.0都優於1.3。對於你的問題最可能的答案是,如果數據集的大小不適合可分割的塊,那麼最終會得到比所需更多的線程和可能的額外內核調用。但是,由於2.0 cc設備具有更多的塊,更大的維度,每塊更多的線程等,所以無法使用1.3設備的性能超過2.0 cc設備。 – slcott 2013-04-23 15:50:53
@slcott ...是的,你可以在性能方面超過2.0設備和1.3設備。嘗試在Tesla C1060(CC 1.3)上運行一段代碼,並在GeForce GT 440(CC 2.1)上運行相同的代碼。猜猜哪一個會更快?器件的內核數量和時鐘速度是決定代碼速度的主要參數。 – sgarizvi 2013-04-23 17:25:01
你能編輯問題以更好地反映你的問題嗎?我認爲你正在尋找計算能力之間的比較,而不是真正的GPU。 – 2013-04-23 16:21:39