0
我有如下因素代碼:爲什麼這個版本和這個版本一樣?
#pragma omp parallel for private(dot,sum,c,cc)
for(r=0;r<rows;r++){
for(c=0;c<cols;c++){
dot = 0.0;
sum = 0.0;
for(cc=(-center);cc<=center;cc++){
if(((c+cc) >= 0) && ((c+cc) < cols)){
dot += (float)image[r*cols+(c+cc)] * kernel[center+cc];
sum += kernel[center+cc];
}
}
tempim[r*cols+c] = dot/sum;
}
}
此代碼以相同的速度secvential版本上運行。我做錯了什麼?行,列的值是4000+,中心在10-30附近。
可能是一個愚蠢的問題,但你有告訴你的編譯器使用OpenMP嗎? – JakubT