pyopencl

    0熱度

    1回答

    將緩衝區作爲參數傳遞給OpenCL內核時,內核代碼所看到的緩衝區的地址是否對同一緩衝區保持不變? 我用下面的代碼來檢查,看起來地址確實是一樣的。但是,我無法在標準中找到任何保證這一點的內容。 import pyopencl as cl import numpy as np def main(): ctx = cl.create_some_context() queue =

    1熱度

    2回答

    我正在使用pyOpenCL來做一些複雜的計算。 它在CPU上運行良好,但在嘗試在NVIDIA GeForce 9400M(256 MB)上運行時出現錯誤。 我正在使用Mac OS X Lion(10.7.5) 奇怪的是,這個錯誤並不總是顯示出來。當我的計算使用更大的數字(導致更大的迭代),但只有在GPU上運行時,纔會出現這種情況。 我不寫信給記憶位置我不應該寫信給。通過將代碼作爲單個工作項運行,我

    1熱度

    1回答

    我一直在嘗試使用PyOpenCL在GPU上對我的FFT程序進行基準測試。在使用OpenCL的'分析'和python的'time'模塊時,我看到完全不同的結果。要使用分析,我做這樣的事情, queue = cl.CommandQueue(ctx,properties=cl.command_queue_properties.PROFILING_ENABLE) <other codes> for i

    0熱度

    1回答

    對於全局內存中的數組X,我需要在每個內核執行中寫入兩個值。 X[p]=mul1+mul2; X[p+a]=mul1-mul2; 這裏'a'的範圍可以從0到很高的值。我觀察到這兩個寫法在很大程度上減緩了我的內核。 什麼是提高OpenCL內存寫入性能的最佳方法? 合併內存寫入可能只適用於內核內寫入?

    1熱度

    1回答

    我按照http://wiki.tiker.net/PyOpenCL/Installation/Mac上的安裝說明進行操作。但它在 make 落在該錯誤消息如下所示: fatal error: /Applications/Xcode.app/Contents/Developer/Toolchains/XcodeDefault.xctoolchain/usr/bin/lipo: can't fig

    2熱度

    3回答

    我得到了一個GTX 770,它明顯安裝了opencl 1.1及其圖形驅動程序。 但是我安裝了AMD APP(無論如何都得到了一個AMD CPU),無論如何它不重要,因爲pyopencl不會工作!它在導入時不斷吐出相同的錯誤; Traceback (most recent call last): File "C:\Users\Vegard\Dropbox\programming\openc

    0熱度

    1回答

    我很難用PyOpenCl做一個基本的標量操作 基本上,我想要做的是給定一個浮點型數組,每個數組元素乘以一個標量浮點數並將結果放在新的緩衝區中。這應該很容易,但由於某種原因,它不應該如此。 這是我正在使用的代碼:(帶_h變量是HOST變量;用_g變量是裝置變量) import numpy as np import pyopencl as cl # Device Init ctx = cl.cr

    3熱度

    1回答

    有沒有辦法在頁面邊界上分配numpy array的數據部分(即數據)? 爲什麼我不在乎,如果我是英特爾的設備上使用PyOpenCL,我想創建使用CL_MEM_USE_HOST_PTR,they recommend該數據1)頁對齊的緩衝區和2)大小的緩存行的倍數。 有在分配頁對齊的內存Ç各種方式,例如參見:aligned malloc() in GCC?

    3熱度

    3回答

    使用Ubuntu python-pyopencl軟件包進行安裝後,PyOpenCL無法訪問我的Nvidia設備。這種安裝PyOpenCL的方法用於使用相同的硬件和相同版本的Ubuntu(14.10)。 當運行pyopencl.get_platforms()的錯誤信息是: LogicError: clGetPlatformIDs failed: platform not found khr 我曾

    3熱度

    1回答

    我試圖從一般的pyOpenCL和GPGPU開始。 對於下面的dot產品代碼,我得到了GPU和CPU版本之間相當不同的結果。我究竟做錯了什麼? 對於浮點錯誤來說,約0.5%的差異似乎很大,以解決差異。數組大小(〜9e-8相對於數組大小10000)的差異似乎增加了。也許這是跨塊合併結果的問題......?無論哪種方式,讓我感到不安。 我不知道它的問題:我在MacBook Air上,英特爾(R)酷睿(T