pyopencl

0熱度

1回答

將緩衝區作爲參數傳遞給OpenCL內核時，內核代碼所看到的緩衝區的地址是否對同一緩衝區保持不變？我用下面的代碼來檢查，看起來地址確實是一樣的。但是，我無法在標準中找到任何保證這一點的內容。 import pyopencl as cl import numpy as np def main(): ctx = cl.create_some_context() queue =

1熱度

2回答

在GPU上運行時，如何對同一陣列進行大量分配會導致pyopencl.LogicError？

我正在使用pyOpenCL來做一些複雜的計算。它在CPU上運行良好，但在嘗試在NVIDIA GeForce 9400M（256 MB）上運行時出現錯誤。我正在使用Mac OS X Lion（10.7.5）奇怪的是，這個錯誤並不總是顯示出來。當我的計算使用更大的數字（導致更大的迭代），但只有在GPU上運行時，纔會出現這種情況。我不寫信給記憶位置我不應該寫信給。通過將代碼作爲單個工作項運行，我

1熱度

1回答

PyOpenCL程序的基準標記

我一直在嘗試使用PyOpenCL在GPU上對我的FFT程序進行基準測試。在使用OpenCL的'分析'和python的'time'模塊時，我看到完全不同的結果。要使用分析，我做這樣的事情， queue = cl.CommandQueue(ctx,properties=cl.command_queue_properties.PROFILING_ENABLE) <other codes> for i

0熱度

1回答

在OpenCL中改善內存訪問時間

對於全局內存中的數組X，我需要在每個內核執行中寫入兩個值。 X[p]=mul1+mul2; X[p+a]=mul1-mul2; 這裏'a'的範圍可以從0到很高的值。我觀察到這兩個寫法在很大程度上減緩了我的內核。什麼是提高OpenCL內存寫入性能的最佳方法？合併內存寫入可能只適用於內核內寫入？

1熱度

1回答

在Mac OS X上安裝PyOpenCl時出錯

我按照http://wiki.tiker.net/PyOpenCL/Installation/Mac上的安裝說明進行操作。但它在 make 落在該錯誤消息如下所示： fatal error: /Applications/Xcode.app/Contents/Developer/Toolchains/XcodeDefault.xctoolchain/usr/bin/lipo: can't fig

2熱度

3回答

在Windows上安裝pyopencl

我得到了一個GTX 770，它明顯安裝了opencl 1.1及其圖形驅動程序。但是我安裝了AMD APP（無論如何都得到了一個AMD CPU），無論如何它不重要，因爲pyopencl不會工作！它在導入時不斷吐出相同的錯誤; Traceback (most recent call last): File "C:\Users\Vegard\Dropbox\programming\openc

0熱度

1回答

PyOpencl - 錯誤的參數傳遞給kernell

我很難用PyOpenCl做一個基本的標量操作基本上，我想要做的是給定一個浮點型數組，每個數組元素乘以一個標量浮點數並將結果放在新的緩衝區中。這應該很容易，但由於某種原因，它不應該如此。這是我正在使用的代碼：（帶_h變量是HOST變量;用_g變量是裝置變量） import numpy as np import pyopencl as cl # Device Init ctx = cl.cr

3熱度

1回答

在numpy中獲取頁面對齊的內存

有沒有辦法在頁面邊界上分配numpy array的數據部分（即數據）？爲什麼我不在乎，如果我是英特爾的設備上使用PyOpenCL，我想創建使用CL_MEM_USE_HOST_PTR，they recommend該數據1）頁對齊的緩衝區和2）大小的緩存行的倍數。有在分配頁對齊的內存Ç各種方式，例如參見：aligned malloc() in GCC?

3熱度

3回答

PyOpenCL Ubuntu Nvidia - 未找到平臺

使用Ubuntu python-pyopencl軟件包進行安裝後，PyOpenCL無法訪問我的Nvidia設備。這種安裝PyOpenCL的方法用於使用相同的硬件和相同版本的Ubuntu（14.10）。當運行pyopencl.get_platforms()的錯誤信息是： LogicError: clGetPlatformIDs failed: platform not found khr 我曾

3熱度

1回答

pyOpenCL獲得與numpy相比的不同結果

我試圖從一般的pyOpenCL和GPGPU開始。對於下面的dot產品代碼，我得到了GPU和CPU版本之間相當不同的結果。我究竟做錯了什麼？對於浮點錯誤來說，約0.5％的差異似乎很大，以解決差異。數組大小（〜9e-8相對於數組大小10000）的差異似乎增加了。也許這是跨塊合併結果的問題......？無論哪種方式，讓我感到不安。我不知道它的問題：我在MacBook Air上，英特爾（R）酷睿（T