1
在CUDA中執行此操作的最佳方法是什麼?用cuda代替c for循環
...
for(int i=0;i<size;++i)
for(int j=i+1;j<size ;++j)
temp_norm+=exp((train[i]-train[j])/tau);
這是否等同?
...
int i = threadIdx.x + blockIdx.x * blockDim.x;
int j = threadIdx.y + blockIdx.y * blockDim.y;
if (i>=size || j>=size) return;
if(j>i)
temp_norm+=exp((train[i]-train[j])/tau);
任何幫助將不勝感激!