前一個問題問如何找到找到CUDA數組的最大值有效:Finding max value in CUDA,頂響應優化減少內核提供了一個鏈接到NVIDIA演示。 如果您使用Visual Studio,只需刪除標題引用以及CPU執行之間的所有內容。 我設置,其中發現的最大一個變體,但它不匹配什麼CPU被發現: // Returns the maximum value of
// an array of
我已經經歷了幾個例子,將一組元素減少爲一個元素,但沒有成功。有人在NVIDIA論壇上發佈了這個消息。我已經從浮點變量更改爲整數。 __kernel void sum(__global const short *A,__global unsigned long *C,uint size, __local unsigned long *L) {
unsigned long sum=0;