14
我下面就this SO answer的說明,但是當我嘗試運行所產生的PTX文件,我得到了如下錯誤clBuild使用Clang編譯OpenCL到PTX時無法解析的extern?
ptxas fatal : Unresolved extern function 'get_group_id'
在PTX文件每OpenCL的函數調用,我有以下我用
.func (.param .b64 func_retval0) get_group_id
(
.param .b32 get_group_id_param_0
)
;
上面的內容在OpenCL運行時創建的PTX文件中不存在,當我將它提供給CL文件時。相反,它有適當的專用寄存器。
繼these instructions的LLVM IR期間,出現以下錯誤(針對不同的libclc庫鏈接)給了我一個分段故障到PTX編譯:
fatal error: error in backend: Cannot cast between two non-generic address spaces
是這些指令是否仍然有效?還有什麼我應該做的?
我使用的是最新版本libclc,鐺3.7和NVIDIA驅動程序352.39