0
A
回答
2
連續代碼仍然會按順序計算,唯一的變化是所有線程都會並行計算此代碼。
假設下面這個簡單的內核(蔻這裏寫下來,未測試):
__global__ void kernel(int *array, int N)
{
if (threadIdx.x < N)
{
// complete for loop is computed parallel for different threads
for (int i=0; i<1000; i++)
{
// every single thread perfomes this statement 1000 times
array[threadIdx.x] += i;
}
}
}
爲同一經線中不同線程的完整的循環將被計算並行。但是每一個線程都會爲自己的循環順序計算這個值。
相關問題
- 1. 定時並行CUDA內核
- 2. CUDA並行內核執行,每個流有多個內核
- 3. cuda瞭解併發內核執行
- 4. CUDA流和併發內核執行
- 5. 執行CUDA內核幾次
- 6. CUDA 2D內核合併內存
- 7. 在CUDA內核
- 8. CUDA塊並行性
- 9. 配置文件併發CUDA內核
- 10. 併發內核啓動示例 - CUDA
- 11. CUDA內核的奇怪行爲
- 12. CUDA上的定時內核執行
- 13. 調用CUDA內核
- 14. CUDA內核掛起
- 15. 使用CUDA內核
- 16. CUDA同步內核
- 17. CUDA內核函數
- 18. Cuda內核配置
- 19. cuda - 內核優化
- 20. CUDA內核參數
- 21. 調試CUDA內核
- 22. 在CUDA中並行運行多個子內核
- 23. 併發CUDA內核執行的優先級
- 24. 並行化來自CUDA設備函數/內核的方法
- 25. 內核中的CUDA流ID
- 26. Cuda的:內核調用
- 27. CUDA:內核CRT的文檔?
- 28. CUDA中的嵌套內核
- 29. CUDA中的內核調用
- 30. CUDA內核的參數