2011-09-21 63 views
2

我該如何估計我不擁有的卡的cuda性能,即。新卡?例如,我發現一個不完整的Cuda示例,作者寫道,他的GF 8600 GT需要0.7秒。但在我的Quadro上需要1.7秒。如何估算CUDA gpus的相對性能?

我的問題是:我用來填補空白的代碼是錯誤的還是GF 8600的速度真的是兩倍?

內核是內存綁定的,但我的卡有更高的內存帶寬。我不知道從中得出什麼結論。

Name    Quadro FX 580  GeForce 8600 GT 
CUDA Cores     32     32 
Core clock (MHz)    450     540 
Memory clock (MHz)   400     700 
Memory BW (GB/s)    25.6    22.4 
Shader Clock (MHz)   ????    1180 
+0

根據我的經驗,這兩款GPU之間的性能應該非常相似。硬件或軟件配置上的差異可能會導致性能差距。專用的GPGPU卡可以顯示比同時用於輸出視頻信號的gpu更好的性能(特別是在運行Windows Aero或Compiz時)。另外,如何測量時間?總體而言,發佈一些代碼和更詳細的PC配置可能會有所幫助,但如果不進行測試/性能分析,難以做出準確的評估。 – aland

回答

2

只是想爲您提供一些可能是錯誤來源的指針。首先,使用cudaEvents來定時代碼,而不是cuda profiler,因爲cudaEvents更準確。其次,請檢查作者正在衡量的內容;他只是在談論計算時間,還是他正在考慮將數據傳輸到GPU和從GPU傳輸數據的時間。你在同一時間測量嗎?其次,cuda體系結構正在發生相當快的變化。例如,對於使用cc 1.x的卡片,建議我們應該使用共享內存來獲得更好的性能;然而,對於使用cc 2.x的卡,每個多處理器都有一個L1高速緩存,可以快速訪問全局內存。所以,你可能想要比較兩張卡的架構和他們的計算能力。