0
因此,在OpenCL中編寫內核非常簡單,只需要少量輸入Image3D輸出一些輸出Image3D並對它們執行一些操作即可。只要所有輸入和輸出圖像都適合GPU內存,就很容易。現在通常情況並非如此,因爲隨着您的分辨率的提高,Image3D的規模不斷擴大。 因此,給定一個內核可以讓我們說4個輸入圖像和3個輸出圖像,那麼在適合GPU的區塊中處理它們的最佳選擇是什麼。是否有自動流式傳輸/緩衝的形式?如何使用OpenCL處理GPU內存過大的圖像
最佳這裏是指:1)快速,2)小用戶編寫的代碼(兩個)
嘗試use_host_ptr並計算1/10大小的塊,並在需要時添加僅用於內核的1/10大小的臨時設備端緩衝區。 –