2012-10-16 147 views
0

我剛剛從CUDA 4遷移至5並安裝剛剛發佈CUDA 5.0在Ubuntu 12.04,但性能已經大幅下降。過去需要1秒鐘的特定CUDA內核需要6秒。看來,新車手是罪魁禍首,因爲當我重新安裝舊車時,4名車手的表現恢復了,但我不知道爲什麼。有沒有人遇到類似的問題?CUDA 5.0驅動程序慢

+0

這個內核的編譯器統計信息在CUDA 4.0和CUDA 5.0(寄存器數量,溢出位置等)方面明顯不同?將-Xptxas -v添加到您的nvcc命令行以查看統計信息。你如何衡量內核執行時間?測量它的簡單方法是導出CUDA_PROFILE = 1打開簡單分析,然後檢查生成的日誌文件。這也將顯示內核的佔用情況。您是否看到兩個CUDA版本的佔用率有差異?你在做什麼GPU? – njuffa

+4

一般來說,這個問題需要更多的信息來回答。 – harrism

回答

2

道歉了那麼久纔回來..

我發現罪魁禍首是__threadfence()。不能很好地理解它的使用,我寫的東西像

__threadfence() 
__syncthreads() 

在新的驅動程序這是採取了很多額外的時間

我工作的GTX680

非常感謝 丹尼爾

相關問題