我是使用Visual Studio C#使用OpenCL(與OpenCL.NET庫)的新手,目前正在研究計算大型3D矩陣的應用程序。在矩陣中的每個像素處,計算192個唯一值,然後相加以產生該像素的最終值。因此,在功能上,它就像一個4-d矩陣,(161 X 161 X 161)×192 現在我打電話從我的主機代碼這樣的內核: //C# host code
...
float[] BigMatri
在CUDA發現連續指數涵蓋多個塊,從而incerase指數的範圍陣列,我們做一些事情是這樣的: 主機端代碼: dim3 dimgrid(9,1)// total 9 blocks will be launched
dim3 dimBlock(16,1)// each block is having 16 threads // total no. of threads in
/