爲特定線程配置調用CUDA內核時, 上存在哪些內存空間(設備/主機)內核參數應該存在的嚴格規則以及它們應該是什麼類型?CUDA內核的參數
假設我啓動的線程的與
kernel<<<numblocks, threadsperblock >>> (/*parameters*/)
1-d網格我可以傳遞一個整數參數int foo
其爲主機 -integer變量, 直接向CUDA內核?或者我應該將cudaMalloc
內存的單個整數表示爲dev_foo
,然後cudaMemcpy
foo
分成devfoo
,然後通過devfoo
作爲內核參數?