CUDA在各處都有大量文檔和指南,但我一直無法找到的是如何診斷編譯內核的任何形式的指令,但會得到諸如此類的模糊的錯誤消息作爲超出正常範圍的「未指定的啓動失敗」「這些塊/網格結構是否有意義?等診斷CUDA內核問題
我可以以某種方式攔截cubin文件,並對內存結構等做一些靜態分析?原諒我的不高興,但我無法在任何地方找到任何明確的白癡指南。
祝大家週末愉快。
我正在尋找
- 如何分離出的cubin中間文件
- 做什麼用它之後制定出了什麼事情,特別是註冊和內存配置,看看我的代碼違反了任何硬件要求,或者如果我在某處錯過了一個錯誤的錯誤。
對於任何人碰到這個未來更高版本(我似乎已經創建,使保持顯示在我自己的查詢個月後......問題的習慣)CUDA-Memcheck給出更有趣的反應是,「檢查錯誤」處理。例如
========= Error: process didn't terminate successfully
========= Invalid __global__ write of size 4
========= at 0x00000040 in decomp
========= by thread (1,0,0) in block (0,0,0)
========= Address 0x00101024 is out of bounds
=========
========= ERROR SUMMARY: 1 error
我甚至沒有解釋該錯誤信息......
所以我認爲我們回答了第1部分,CUBIN文件。第2部分可能取決於你在做什麼。你能舉出一個你遇到這些錯誤的場景的具體例子嗎? – 2011-04-16 17:19:13