2
僅查看CUDA生成的代碼類型,除了目標文件之外,我還想編譯爲ptx。由於我的一些循環展開可能需要相當長一段時間,我想能夠編譯*.cu
→*.ptx
→*.o
,而不是浪費時間與兩個*.cu
→*.ptx
和*.cu
→*.o
,這我目前這樣做。NVCC使用PTX輸出單獨編譯
只需將-ptx
添加到nvcc *.cu
行即可獲得所需的ptx輸出。
使用ptxas -c
來編譯*.ptx
到*.o
工程,但導致我的可執行文件鏈接錯誤:Relocations in generic ELF (EM: 190)
。
試圖編譯*.ptx
與nvcc
失敗默默,輸出什麼。
有一些選項,我需要傳遞給ptxas
?我應該如何通過單獨編譯通過ptx進行正確編譯?或者,我可以告訴nvcc
保留ptx嗎?