0
流是否可能比普通的CUDA程序花費更長的時間?可以保證流操作的數據塊是獨立的,並且允許從設備端執行內核執行和數據傳輸。需要更長時間的CUDA流
流是否可能比普通的CUDA程序花費更長的時間?可以保證流操作的數據塊是獨立的,並且允許從設備端執行內核執行和數據傳輸。需要更長時間的CUDA流
要觀察流之間的疊加,應該使用帶有conckerneltrace
選項的命令行分析器。您還可以將分析輸出保存爲.csv文件並將其導入到Visual Profiler中。查看NVIDIA論壇帖子
您是否正在運行探查器?分析器序列化所有呼叫。 – 2012-03-30 20:47:12
可能的重複[我們真的可以獲得CUDA流的性能增益嗎?](http://stackoverflow.com/questions/8284680/can-we-really-get-performance-gain-with-cuda-streams) – talonmies 2012-03-30 21:08:58
@RogerDahl我應該如何在linux上安裝profiler? – 2012-03-30 22:37:10