pycuda

    0熱度

    1回答

    我想在GPU上並行化一個python循環,但我不想使用pyCUDA,因爲我需要自己做很多事情。我正在尋找OpenACC之類的東西,就像C++中的python一樣來實現簡單的並行化,但似乎沒有這樣的事情。所以我想在C++中使用OpenACC,然後系統調用一個pthon腳本,如下面的代碼所示。這會工作嗎?還是有沒有簡單的選擇,而不使用pyCUDA? void foo(float*parameters)

    -1熱度

    1回答

    我想在我的anaconda包中添加pycuda,所以我安裝了這個文件pycuda-2016.1.2 + cuda8044-cp35-cp35m-win_amd64.whl from http://www.lfd.uci.edu/~gohlke/pythonlibs/?cm_mc_uid=85766897061814897087787&cm_mc_sid_50200000=1489708778#py

    -1熱度

    1回答

    有沒有什麼方法可以單獨使用CUDA或NVidia提供的相同功能來查找矩陣行中元素的排名?

    0熱度

    1回答

    是否有可能在PyCUDA中調用__host__函數,例如__global__函數?我在文檔中注意到pycuda.driver.Function創建了一個__global__函數的句柄。 __device__函數可以從__global__函數中調用,但__host__代碼不能。我知道,使用主機函數幾乎會破壞PyCUDA的目的,但是有一些已經創建的函數可以作爲概念證明來導入和調用。 作爲一個說明,每當

    2熱度

    1回答

    我想爲兩個數組構建一個相等檢查器,我可以使用PyCUDA在GPU上運行它。 按照PyCUDA GPU Arrays documentation page上給出的例子,我試圖編寫自己的實現。但是,儘管下面的代碼按照算術的預期工作,例如"z[i] = x[i] + y[i]",它返回相等檢查器操作數"z[i] = x[i] == y[i]"的錯誤輸出。 import pycuda.gpuarray a

    3熱度

    1回答

    我正在使用PyCUDA,CUDAMat和Numba對GPU矩陣乘法進行基準測試,並遇到了一些行爲,我無法找到解釋方法。 我計算了3個不同步驟獨立需要的時間 - 將2個矩陣發送到設備存儲器,計算點積,並將結果複製回主機存儲器。 點積步驟的基準測試在一個循環中完成,因爲我的應用程序在發送結果之前將進行多次乘法運算。 隨着我增加循環次數,點積時間線性增加,就像預期一樣。但我無法理解的部分是,將最終結果發

    5熱度

    1回答

    我剛剛安裝pyCuda,當我嘗試編譯: 進口pycuda.autoinit 進口pycuda.driver爲DRV 進口numpy的 from pycuda.compiler import SourceModule mod = SourceModule(""" __global__ void multiply_them(float *dest, float *a, float *b) {

    2熱度

    1回答

    我是CUDA新手,想弄清楚PyCUDA (free)或NumbaPro CUDA Python(不是免費)對我來說是否會更好(假設圖書館的成本不是問題)。 兩者似乎都要求您使用各自的Python方言。但是,PyCUDA似乎要求你在C代碼中編寫內核函數,這比使用NumbaPro更麻煩,而NumbaPro似乎爲你做了所有的辛苦工作。 這的確是這樣嗎?會有明顯的性能差異嗎?

    0熱度

    1回答

    我使用1kB .png文件(即2048x2048 numpy array)來測試我的PyCuda程序,它顯示程序花費了大約1.57s來分配數據並將其複製到設備。 這是正常的需要如此長的時間? 我不知道PyCuda和Cuda C在分配和memcpy過程中是否有性能差異? (使用PyCuda內核時依然用C寫的,內核執行時間爲0.17s,所以我覺得它的時間太長做準備。) 分配代碼和memcpy img_

    0熱度

    1回答

    我正在嘗試使用Pycuda示例MultipleThreads在GPU上運行多個線程。當我運行我的Python文件,我得到了以下錯誤消息: (/root/anaconda3/) [email protected]:~/pycuda# python multiplethreads.py Exception in thread Thread-5: Traceback (most recent cal