我將一個程序從IDL轉換爲CUDA,該程序對256X256Xn密度的多維數據集執行一些計算並呈現二維圖像。該程序正常工作,但所有預處理仍然在IDL中完成(例如讀取密度立方體等),並將該信息傳遞給包裝函數(使用call_external到C程序),然後調用CUDA。將NVIDIA Visual Profiler用於由包裝函數調用的CUDA程序
目前我正在嘗試優化程序,並希望使用NVIDIA Visual Profiler來檢查我的聚並,並想知道是否有辦法做到這一點...一種讓視覺輪廓儀運行的方式,當我們調用CUDA程序的一部分?
我目前無法測試任何東西,因爲有太多變量只是硬編碼到CUDA函數中,但沒有從IDL傳遞到C到CUDA的那些值無法運行。
我確實已經設置好了,所以我可以運行IDL,讓它停下來然後手動調用C wrapper函數,而不是僅僅運行IDL並讓它自動執行所有操作。
謝謝
您是否嘗試過通過視覺分析器運行IDL程序?我已經使用python + pyCUDA完成了這個任務 - 運行幾層python,然後啓動內核 - 並且profiler成功地分析了內核。 – 2012-01-18 14:11:03