-2
我嘗試實現這個TILE_DIM和BLOCK_ROWS無法解析
__global__ void transposeNaive(float *odata, const float *idata)
{
int x = blockIdx.x * TILE_DIM + threadIdx.x;
int y = blockIdx.y * TILE_DIM + threadIdx.y;
int width = gridDim.x * TILE_DIM;
for (int j = 0; j < TILE_DIM; j+= BLOCK_ROWS)
odata[x*width + (y+j)] = idata[(y+j)*width + x];
}
爲什麼我得到這個錯誤?這裏出了什麼問題?爲什麼我得到這個錯誤?
這個問題就像「用適當的詞填補空白!」你從哪裏取回這個內核? – ahmad