pycuda

    2熱度

    1回答

    我想學習CUDA並用PyCUDA來編寫一個簡單的矩陣乘法代碼。兩個4×4隨機生成的矩陣的I得到以下溶液: Cuda: [[ -5170.86181641 -21146.49609375 20690.02929688 -35413.9296875 ] [-18998.5 -3199.53271484 13364.62890625 7141.36816406] [ 31197.4316406

    4熱度

    2回答

    我試圖建立一個3D環與我的GPU使用Python分配 C(i,j,k) = A(i,j,k) + B(i,j,k) CUDA GPU蟒。這是我的GPU: http://www.geforce.com/hardware/desktop-gpus/geforce-gt-520/specifications 我期待在/與比較來源: http://nbviewer.ipython.org/gist/h

    0熱度

    1回答

    我試圖使用(並從中學習)Mark Harris's optimized reduction kernel,通過將其源代碼複製到一個簡單的pycuda應用程序中下面列出了我的嘗試的來源)。 不幸的是,我遇到了以下兩個錯誤之一。 的CUDA內核不能編譯,拋出以下錯誤消息。 kernel.cu(3): error: this declaration may not have extern "C" lin

    0熱度

    1回答

    我試着製作一個pycuda包裝靈感來自scikits-cuda庫,對於Nvidia新的cuSolver庫中提供的一些操作,首先我需要通過cusolverDnSgetrf()執行LU分解操作。但在此之前,我需要'工作區'參數,cuSolver提供的工具名爲cusolverDnSgetrf_bufferSize();但是當我使用它時,只會崩潰並返回分段錯誤。我做錯了什麼? 注意:我已經使用scikit

    3熱度

    1回答

    試圖導入與初始化設備時使用Python33在Windows 8.1 CUDA工具包5.5和安裝的硬件: import pycuda.driver as cuda import pycuda.autoinit from pycuda.compiler import SourceModule <--- this line causes the error 我得到下面的錯誤: Traceback

    0熱度

    1回答

    我在沒有su訪問權的機器上使用Canopy enthought。 每當我嘗試建立任何軟件包依賴蟒我得到這個錯誤: 在/ usr /斌/勞工處:找不到-lpython2.7 collect2:LD返回1個退出狀態 錯誤:命令「G ++ '退出狀態失敗1 任何想法發生了什麼問題? 我正在運行Debian OS。 感謝

    3熱度

    1回答

    我的程序有一個非常奇怪的問題。本質上,我正在對矩陣的一部分進行矩陣乘法。該程序顯然在大多數卡上運行良好,但在sm_35開普勒(= GK110)卡上發生崩潰。 最初的計劃是寫在PyCUDA,但我已經因爲成功地熬下來,以C語言編寫以下小例子: #include <stdio.h> #include <stdlib.h> #include <string.h> #include <cuda.h>

    2熱度

    1回答

    我在python中有一個for循環,我想展開到GPU上。我想應該有一個簡單的解決方案,但我還沒有找到一個。 我們的函數遍歷numpy數組中的元素並執行一些數學運算,將結果存儲在另一個numpy數組中。每次迭代都會爲此結果數組添加一些內容。我們的代碼可能大的簡化可能看起來像這樣: import numpy as np a = np.arange(100) out = np.array([0,

    1熱度

    1回答

    我試圖在pyCUDA中啓動一個內核,然後通過寫入GPU全局內存位置來終止內核。下面是一個簡單的例子內核,我希望能夠在某些時候終止它的狀態時,無限後循環: __global__ void countUp(u16 *inShot, u64 *counter) { while(inShot[0]) { counter[0]++; } } 從我所瞭解的CUDA流,我應該

    2熱度

    1回答

    我想在PyCUDA初始化2D表面,並與來自NumPy的2D array.The想法值填充它,因爲我得到它,是 開放drv.ArrayDescriptor, 使用此描述創建drv.Array,從NumPy的陣列 複製數據與drv.Memcpy2D, 爲SurfaceReference做set_array。 但是我仍然在最後一步有pycuda._driver.LogicError。我在做什麼小例子: