- 請問下面的代碼是否按順序執行? (我不能將
cudaMemcpy2DArrayToArray()
的設備到設備副本放在stream
中) - 下面的代碼是否會異步執行? (
cudaMemcpy2DArrayToArray()
不具有異步對應)
我知道代碼樣品可以更有效地實施,但是它僅僅意在作爲示例。此CUDA代碼是否按順序和異步執行?
for(i=0; i<10; i++)
{
cudaMemcpy2DArrayToArray(dst, src); // device to device copy.
cudaBindTextureToArray(texture_reference, dst, ...) // bind dst to texture.
kernel<<< dimGrid, dimBlock, 0, stream >>>(out) // compute an array.
cudaMemcpy2DToArrayAsync(src_p, out, stream) // copy result to src.
}
我不確定這一點,但可能是你可以使用'cudaMemcpy3DAsync'異步地從陣列複製到陣列。由於'struct cudaMemcpy3DParms'具有源和目標'cudaArray'的字段。 – sgarizvi 2013-05-02 14:38:08