2012-03-30 82 views
0

流是否可能比普通的CUDA程序花費更長的時間?可以保證流操作的數據塊是獨立的,並且允許從設備端執行內核執行和數據傳輸。需要更長時間的CUDA流

+0

您是否正在運行探查器?分析器序列化所有呼叫。 – 2012-03-30 20:47:12

+0

可能的重複[我們真的可以獲得CUDA流的性能增益嗎?](http://stackoverflow.com/questions/8284680/can-we-really-get-performance-gain-with-cuda-streams) – talonmies 2012-03-30 21:08:58

+0

@RogerDahl我應該如何在linux上安裝profiler? – 2012-03-30 22:37:10

回答

1

要觀察流之間的疊加,應該使用帶有conckerneltrace選項的命令行分析器。您還可以將分析輸出保存爲.csv文件並將其導入到Visual Profiler中。查看NVIDIA論壇帖子

CUDA stream performance