pyopencl

    0熱度

    1回答

    我想要做矩陣乘法與2個非方陣,(2000,100),(100,100),我嘗試用塊子矩陣作爲Nvidia的例子,但結果是錯誤的,我在這裏找到了解決方法。 Non Square Matrix Multiplication in CUDA 它使用的零填充,所以我改變塊的大小爲16,但它是一個錯誤的工作組大小, 我用pyopencl而不能使用布拉斯等。

    0熱度

    1回答

    我們可以在同一設備上有多個上下文嗎?如果是,那麼它是可以同時使用還是並行(在同一時間點)?

    5熱度

    1回答

    我工作一段的OpenCL代碼爲一個專門的矩陣功能:爲Dx1矢量v,二DxD矩陣A和B和恆定c,返回1xD矢量r其中r[i] = c * sum_over_j (v[j] * A[i][j] * B[i][j]) 下面是我有這麼遠,但它運行速度非常緩慢。沒有求和的版本返回DxD矩陣的速度大約快10倍。如果這有什麼不同,它會從PyOpenCL中調用。 有什麼事情做錯了嗎?它可以優化嗎? #define

    0熱度

    1回答

    在OpenCL中是否有用於查找GPU中複製引擎的數量的API?在cuda中,我們可以使用asyncEngineCount.來檢查此問題OpenCL中的替代方法是什麼?

    1熱度

    1回答

    此功能註釋掉的PyOpenCL文檔中:http://documen.tician.de/pyopencl/runtime.html?highlight=enqueue#pyopencl.Event.wait 我的問題是:我要調用內核在一個for循環和之後的每個呼叫排隊的複製操作與pyopencl.enqueue_copy_buffer(dest, src, size)。首先我用.wait()(即p

    0熱度

    1回答

    如何在Mac OSX上使用Python加載OpenCL? 輸出 Chriss-MacBook-Pro:phoenix2-phoenix-2c83ee6 chris$ python opencl.py [22:17:15] Python OpenCL Info v0.1 [22:17:15] Python Version: 2.7.2 64bit [22:17:15] PyOpenCL Pat

    3熱度

    1回答

    我正在將模擬轉移到pyOpenCL中,無法讓我的數據訪問工作。我試圖提供一維向量數組(實際上有好幾個,但我剛剛使用的例子只是使用了一個)。 目前,幾個向量複製過來很好,但數據根本不是我提供的。 我不認爲我已經在這裏發佈過,所以如果任何格式/演示文稿是錯誤的道歉。此外,我剛剛刪除了所有的模擬代碼,所以我意識到這段代碼目前沒有做任何事情,我只想讓緩衝區傳遞正確。 在此先感謝。 內核(kertest.p

    0熱度

    1回答

    這是使用英特爾SDK(1.5 x64)的OpenCL 1.1。 PyOpenCL 2011.2。我在Linux上(Fedora)。 下面的代碼打印"DERP1",但沒有別的。 import pyopencl as cl import numpy import struct ctx = cl.create_some_context() queue = cl.CommandQueue(ctx

    5熱度

    1回答

    我嘗試從Py2Exe製作一個.exe文件時遇到了一些PyOpenCL模塊問題。 Py2Exe使得它應該這樣做(沒有「ImportError:No module named pyopencl」),但是當我運行.exe時,它說沒有名爲pyopencl的模塊。 我正在試着製作Phoenix Miner的一個.exe。 我setup.py: from distutils.core import setup

    5熱度

    4回答

    雖然在Ubuntu集合Python程序的製作nosetests發生錯誤: 器件= [在cl.get_platforms d爲d()[0] .get_devices( )如果 LogicError:clGetPlatformIDs失敗:平臺不在cl.get_platforms發現KHR 文件 「/home/fateeva/prog/deflectometry/SGMFMeasurement/_Pha