2011-03-08 72 views
1

也許這個問題有點過於籠統,但也許有人遇到同樣的問題。Cuda性能問題

我有一個使用推力的小型cuda程序,一切都很好。它按預期工作。

但是,當我將同一個程序移植到另一臺機器時,整個程序的性能比原始機器慢大約10到100倍。第二臺機器的硬件應該更快(GTX480,而不是GTX265),所以我想這個問題在第二臺機器上。有沒有人有一個想法可能會出錯?

+0

我想我找到了解決方案。必須在GTX480器件上使用--arch = sm_20進行編譯。我用--arch = sm_13。 – headmyshoulder 2011-03-08 17:50:43

回答