在這個帖子中x64 allows less threads per block than Win32?有一個關於註冊表不足的問題。我對Nvidia已經放棄了對CUDA 7.5及更高版本x86的支持。這可能是一個愚蠢的問題,但這是否意味着所有的指針都需要兩個寄存器?那可能更少的線程/塊將是事情繼續前進的方式嗎?
主持我已經聲明使用 myKernel.SetConstantVariable("myStaticArray", new int[]{1,2,3,4,5});
在kernel.cu文件的靜態數組 __device__ int myStaticArray[5];
我可以從主機修改此數組數處理後,我想將這個數組複製到主機,我該怎麼做? EDIT1:我注意到每次運行新內核時,數組都會被重置。我不能