pyopencl

    0熱度

    1回答

    我有一個內核源代碼,可以在我的PC上的G970上運行,但不會在我的2015年初MacBook Pro上使用Iris 6100 1536MB圖形進行編譯。 platform = cl.get_platforms()[0] device = platform.get_devices()[1] # Get the GPU ID ctx = cl.Context([device]) # Tell

    0熱度

    2回答

    以下是參考我的工作代碼: vector = numpy.array([1, 2, 4, 8], numpy.float32) #cl.array.vec.float4 matrix = numpy.zeros((1, 4), cl.array.vec.float4) matrix[0, 0] = (1, 2, 4, 8) matrix[0, 1] = (16, 32, 64, 128) m

    1熱度

    1回答

    我有使用PyOpenCL添加多維數組的代碼。我的問題是,除了第一個維度外,結果都是錯誤的。我一直在諮詢這Link。 from __future__ import absolute_import, print_function import numpy as np import pyopencl as cl N = 4 a_np = np.random.rand(N,N).astype(n

    0熱度

    1回答

    我剛剛開始使用pyopencl模塊查看python中的OpenCl。 我有興趣生成沒有任何輸入的東西,例如生成正弦波的樣本。 要做到這一點,我需要的只是全局ID來進行計算,但是返回全局ID會導致一些奇特的數字。我用下面的代碼: import numpy as np import pyopencl as cl Size = Width*Height # Get platforms, bot

    0熱度

    1回答

    我試圖用PyOpenCL作出一個減少總和,類似於這個例子:https://dournac.org/info/gpu_sum_reduction。我試圖對所有值爲1的矢量求和。第一個元素的結果應該是16384。但是,似乎只有一些要點正在收集。是否需要本地索引?是否有任何競爭條件(當我運行兩次結果是不一樣的)?下面的代碼有什麼問題? import numpy as np import pyopenc

    0熱度

    1回答

    我編程OpenCL通過在Ubuntu 16.04.3 64位上的pyopenCL,在Nvidia的Tesla K10.G2.8GB上的 。 到目前爲止,只要我沒有在我的OpenCL內核中包含頭文件,任何東西都可以平穩運行。一旦,因爲我把#include <stdlib.h>我的頭文件的頂部,我的OpenCL內核的編譯失敗與不同的文件丟失,在他們之中是 gnu/stubs-32.h sys/cde

    1熱度

    1回答

    我試圖將numpy數組作爲opencl向量的數組傳遞給內核。 (np.int32 - > int3 *的numpy數組) 但結果似乎是weired。 如果有人解釋它爲什麼會發生,我們將非常感激。 在此先感謝。 的源代碼: import pyopencl as cl import numpy as np platforms = cl.get_platforms() ctx = cl.Cont

    0熱度

    1回答

    我正在學習在python中使用opencl,我想優化一個函數。我瞭解到,這可以通過將全局內存存儲在本地內存中來完成。然而,它不應該像它應該那樣工作,持續時間是其兩倍。這做得好嗎?我可以更優化此代碼嗎? __kernel void sumOP( __global float *input, __global float *weights, int layer_si

    0熱度

    1回答

    誰能告訴我爲什麼OpenCL告訴我,我的Nvidia Geforce GTX 970只有13個最大計算單位?另外,最大計算單位是否等於執行單位(EU)?因爲在我的Iris 6100筆記本電腦上,device.max_compute_units是48,與圖形卡的EU相同。 import pyopencl as cl platform = cl.get_platforms()[0] device

    1熱度

    1回答

    我真的是OpenCL的新手。我已經從這個網站獲取了示例代碼:http://www.drdobbs.com/open-source/easy-opencl-with-python/240162614?pgno=2,我已經對它進行了一些定製。我的目標是向內核發送一個填充1個數字的4x4矩陣,並從內核恢復它。我知道這是一個微不足道的代碼,但我需要這樣做來了解OpenCL的工作原理。輸入矩陣是這一個: [