以我之前的回答問題:My Previous Question,順便說一句,正確回答了Robert Crovella。CUDA C/C++:相同的可執行文件給出了第一次運行的不同結果
我想出了另一個計算隨機步驟到一個點的內核(通過使用與我以前的問題相同的RNG)並計算該點相對於其先前位置(座標)的能量差異。這是內核:
__global__
void DeltaE(float *X, float *Y,float *Xn, float *Yn, float *step,float *DELTA, curandState *state, const int N,const int n){
int tIdx = blockIdx.x*blockDim.x + threadIdx.x;
int bIdx = blockIdx.x;
//int sIdx = blockIdx.x*blockDim.x;
float x , y;
float rdmn1, rdmn2;
float dIntE = 0.0e0f, dConfE = 0.0e0f, dTotE = 0.0e0f;
if(tIdx < N){
if(tIdx == n){
step[tIdx] = 0.2;
rdmn1 = curand_uniform(&state[tIdx]);
rdmn2 = curand_uniform(&state[tIdx]);
Xn[tIdx] = X[tIdx] + step[tIdx]*(2.0e0f*rdmn1 - 1.0e0f);
Yn[tIdx] = Y[tIdx] + step[tIdx]*(2.0e0f*rdmn2 - 1.0e0f);
dConfE = - (X[tIdx]*X[tIdx] + Y[tIdx]*Y[tIdx]);
dConfE += Xn[tIdx]*Xn[tIdx] + Yn[tIdx]*Yn[tIdx];
}
else{
x = X[tIdx] - X[n];
y = Y[tIdx] - Y[n];
dIntE += -1.0e0f/sqrt(x*x + y*y);
}
__syncthreads();
if(tIdx != n){
x = X[tIdx] - Xn[n];
y = Y[tIdx] - Yn[n];
dIntE += 1.0e0f/sqrt(x*x + y*y);
}
dTotE = dConfE + dIntE;
dTotE = ReduceSum2(dTotE);
if(threadIdx.x == 0)DELTA[bIdx] = dTotE;
}
}
然後我做CPU上最後一筆:
cudaMemcpy(&delta[0],&d_delta[0],blocks.x*sizeof(float),cudaMemcpyDeviceToHost);
float dE = 0;
for(int i = 0; i < blocks.x; i++){
dE += delta[i];
}
我的內核具有以下配置推出:
dim3 threads(BlockSize,BlockSize);
dim3 blocks(ceil(Np/threads.x),ceil(Np/threads.y));
DeltaE<<<blocks.x,threads.x,threads.x*sizeof(float)>>>(d_rx,d_ry,d_rxn,d_ryn,d_step,d_delta,d_state,Np,nn);
中,Np是多少點(我用1k - 4k)。我有一個GeForce 9500 GT,它不支持雙倍。我編譯時不使用flag/no選項。例如,取Np = 1k。當我編譯然後運行時,結果是dE = 6.557993。當我跑第二,第三,第四,無論什麼時候,它都是dE = -0.3515406。有誰知道這是從哪裏來的?
P.S .:我忘了提及,在DeltaE之前就可以找到My Previous Question的相同內核AvgDistance。我不知道這是否有什麼可做的事,但我認爲值得一提。 P.2:nn是任何選擇的點(粒子)。
你cudamemcpy被複制'd_delta'回主變量'三角洲'。然後你的循環正在求和'dE + = energy [i];'主機上'delta'和'energy'之間的連接是什麼? – 2013-03-15 22:13:16
哎呀,對不起......這只是一個輸入錯誤......我會糾正它! – Bessa 2013-03-15 23:52:41
好的,我用新代碼擴展了我爲上一個問題創建的示例應用程序,並且它似乎每次都運行相同。當你說「第一次」時,你的意思是什麼?你編譯之後的第一次?您重啓機器後第一次?如果它正在編譯,你的意思是說,每當你重新編譯它時,它會產生不同的行爲? – 2013-03-15 23:56:05