當我在內核中將展開從8循環增加到9循環時,它會打破out of resources錯誤。 我在How do I diagnose a CUDA launch failure due to being out of resources?中讀到,參數不匹配和寄存器過度使用可能是一個問題,但在這裏似乎不是這樣。 我的核心計算n點和m質心之間的距離,併爲每個點選擇最接近的質心。它適用於8維,但不適用於9.
PyCUDA help explains how to create an empty or zeroed array但不是如何將(?)現有的numpy數組移動到頁鎖定的內存中。我是否需要獲取numpy數組的指針並將其傳遞給pycuda.driver.PagelockedHostAllocation?我該怎麼做? UPDATE < --sniped - > 更新2 感謝talonmies您的幫助。