我認爲我的內核是內存綁定的(因爲大多數GPGPU代碼是內存綁定的),但我實際上並不知道。我怎麼能爲自己找到它。可能必須使用視覺輪廓儀,因爲它取決於使用的GPU。如何找出內核是內存綁定還是計算綁定?
如果在CUDA編程指南或其他NVIDIA文檔中對其進行了說明,請不要猶豫,只是發佈帶有頁碼的鏈接,以便我自己閱讀它。
澄清
我寧願是一般性的「規則」如何確定的限制因素,但在我的特殊情況下,你可以找到我的內核這裏的細節:Using `overlap`, `kernel time` and `utilization` to optimize one's kernels
您是否檢查過CUDA佔用率計算器的內核啓動配置和屬性?肯定會嘗試。然後,分析也是一個好主意。源代碼分析也很有用......你的算術強度是多少?您的全局內存訪問是否合併?等等。 – Patrick87