opencl

    22熱度

    3回答

    我正在研究如何使用GPU來處理流數據。我有兩個選擇,但不能決定走哪條路? 我的指標分析如下: 易於使用的(好API) 社區和文檔 性能 未來 我會在C代碼和Linux下的C++。

    4熱度

    2回答

    我能夠遵循指令和編譯CUDA 3.0,但無法編譯Mac OS X 10.6.3上的OpenCL?

    1熱度

    2回答

    支持Nvidia GTX 295的OpenCL支持Linux或預計在不久的將來?

    4熱度

    1回答

    我想知道在OpenCL中設置爲內核函數的參數數量是否有限制。在設置參數時出現INVALID_ARG_INDEX錯誤。我在內核函數中設置了9個參數。在這方面請幫助我。

    39熱度

    3回答

    我最近一直在玩OpenCL,並且能夠編寫只使用全局內存的簡單內核。現在我想開始使用本地內存,但我似乎無法弄清楚如何使用get_local_size()和get_local_id()一次計算一個「塊」輸出。 例如,假設我想將Apple的OpenCL Hello World示例內核轉換爲使用本地內存的東西。你會怎麼做?這裏的原始內核源代碼: __kernel square( __global

    2熱度

    1回答

    我試圖用OpenCL來並行處理經典的map-reduce問題(它可以與MPI很好地並行),即AMD實現。但結果困擾我。 讓我簡短的有關該問題的第一位。有兩種類型的數據流入系統:特徵集(每個30個參數)和樣本集(每個9000個維度)。從某種意義上說,這是一個經典的地圖縮減問題,我需要計算每個樣本(地圖)上每個要素的得分。然後,總結每個功能的總體評分(Reduce)。有大約10k功能和30k樣本。 我

    0熱度

    1回答

    Linux用於編譯OpenCL SDK的C/C++示例的基本設置是什麼?

    11熱度

    5回答

    當我編寫我的多核編程課程時,我想到了一些很奇怪的東西,我想和你討論一下。 我們被要求創建任何程序,顯示爲多核心平臺編程顯着改善。我決定嘗試在GPU上編寫代碼來嘗試OpenCL。我已經選擇了矩陣卷積問題,因爲我對它很熟悉(我之前用open_mpi對它進行了並行化處理,對於大圖像進行了很大的加速)。 所以在這裏,我選擇一個大的GIF文件(2.5 MB)[2816X2112],我運行順序版本(原始代碼)

    5熱度

    1回答

    我的一位在大學學習遊戲開發的朋友目前正在使用OpenCL學習編程。什麼是一個簡單的項目,教導OpenCL最重要的方面,並可以在大約50 - 100小時內完成?

    11熱度

    2回答

    我有一個問題獨家計算模式與NVidia + OpenCL。 我可以在nvidia-gpu上用nvidia-smi設置獨佔計算模式(來自cuda編程指南3.0的第74頁)。這意味着,只有一個程序可以在GPU上計算。 cuda運行時間自動調度比應用程序。 但我對於這種情況下的OpenCL的程序有問題:與在GPU 如果一個應用程序運行時有設置好的獨特的計算方式和第二的OpenCL程序調用clGetDev