opencl

我最近一直在玩OpenCL，並且能夠編寫只使用全局內存的簡單內核。現在我想開始使用本地內存，但我似乎無法弄清楚如何使用get_local_size()和get_local_id()一次計算一個「塊」輸出。例如，假設我想將Apple的OpenCL Hello World示例內核轉換爲使用本地內存的東西。你會怎麼做？這裏的原始內核源代碼： __kernel square( __global

2熱度

1回答

用opencl解決經典的map-reduce問題？

我試圖用OpenCL來並行處理經典的map-reduce問題（它可以與MPI很好地並行），即AMD實現。但結果困擾我。讓我簡短的有關該問題的第一位。有兩種類型的數據流入系統：特徵集（每個30個參數）和樣本集（每個9000個維度）。從某種意義上說，這是一個經典的地圖縮減問題，我需要計算每個樣本（地圖）上每個要素的得分。然後，總結每個功能的總體評分（Reduce）。有大約10k功能和30k樣本。我

0熱度

1回答

Linux QT OpenCL基本設置

Linux用於編譯OpenCL SDK的C/C++示例的基本設置是什麼？

11熱度

5回答

我的OpenCL內核在更快的硬件上速度更慢..但爲什麼？

當我編寫我的多核編程課程時，我想到了一些很奇怪的東西，我想和你討論一下。我們被要求創建任何程序，顯示爲多核心平臺編程顯着改善。我決定嘗試在GPU上編寫代碼來嘗試OpenCL。我已經選擇了矩陣卷積問題，因爲我對它很熟悉（我之前用open_mpi對它進行了並行化處理，對於大圖像進行了很大的加速）。所以在這裏，我選擇一個大的GIF文件（2.5 MB）[2816X2112]，我運行順序版本（原始代碼）

5熱度

1回答

什麼是學習OpenCL的好項目？

我的一位在大學學習遊戲開發的朋友目前正在使用OpenCL學習編程。什麼是一個簡單的項目，教導OpenCL最重要的方面，並可以在大約50 - 100小時內完成？

11熱度

2回答

獨家計算模式與OpenCL + NVidia

我有一個問題獨家計算模式與NVidia + OpenCL。我可以在nvidia-gpu上用nvidia-smi設置獨佔計算模式（來自cuda編程指南3.0的第74頁）。這意味着，只有一個程序可以在GPU上計算。 cuda運行時間自動調度比應用程序。但我對於這種情況下的OpenCL的程序有問題：與在GPU 如果一個應用程序運行時有設置好的獨特的計算方式和第二的OpenCL程序調用clGetDev