gpu-programming

    0熱度

    1回答

    誰能告訴我爲什麼OpenCL告訴我,我的Nvidia Geforce GTX 970只有13個最大計算單位?另外,最大計算單位是否等於執行單位(EU)?因爲在我的Iris 6100筆記本電腦上,device.max_compute_units是48,與圖形卡的EU相同。 import pyopencl as cl platform = cl.get_platforms()[0] device

    0熱度

    1回答

    CUDA具有的計數 32位和64位類型的內在函數:__popc()和__popcll()。 CUDA是否也有內在函數來獲取32位和64位類型的奇偶校驗? (該奇偶指的整數是否具有偶數或奇數的1比特量。) 例如,GCC有__builtin_parityl()爲64位整數。 而且這裏的C函數做同樣的事情: inline uint parity64(uint64 n){ n ^= n >> 1

    1熱度

    1回答

    我試圖利用我的Nvidia Geforce GT 740M進行並行編程,使用OpenMP和鏗鏘3.8編譯器。 當在CPU上並行處理時,我設法得到想要的結果。但是,在GPU上處理時,我的結果幾乎是隨機數。 因此,我認爲我沒有正確地分配我的線程團隊,並且可能會有一些數據競賽。我想我必須以不同方式執行我的for循環,但我不知道錯誤可能在哪裏。 #include <stdio.h> #include <

    0熱度

    1回答

    我注意到在CUDA中,對緩存和共享內存的延遲訪問權限是相同的。鑑於這個事實他們有什麼不同?我們如何以不同的方式使用它們?

    2熱度

    1回答

    我想爲兩個數組構建一個相等檢查器,我可以使用PyCUDA在GPU上運行它。 按照PyCUDA GPU Arrays documentation page上給出的例子,我試圖編寫自己的實現。但是,儘管下面的代碼按照算術的預期工作,例如"z[i] = x[i] + y[i]",它返回相等檢查器操作數"z[i] = x[i] == y[i]"的錯誤輸出。 import pycuda.gpuarray a

    0熱度

    1回答

    我有一個內核源代碼,可以在我的PC上的G970上運行,但不會在我的2015年初MacBook Pro上使用Iris 6100 1536MB圖形進行編譯。 platform = cl.get_platforms()[0] device = platform.get_devices()[1] # Get the GPU ID ctx = cl.Context([device]) # Tell

    2熱度

    1回答

    我有一個Keras模型,它在8個GPU上進行了培訓。這意味着該模型具有如下塊:with tf.device('gpu:0')。現在我想用另一臺具有4 gpus的pc來應用轉移學習。但是,這會導致錯誤,很可能是因爲模型是通過更多gpus(error: could not set cudnn tensor descriptor: CUDNN_STATUS_BAD_PARAM)進行培訓的。在錯誤日誌中,

    1熱度

    1回答

    在我看來,numpy功能bincount是非常有用和簡單的使用,所以我自然使用TensorFlow中的模擬功能。最近我瞭解到,不幸tf.bincount不支持GPU(因爲您可以閱讀here)。在TensorFlow 與 GPU中有效嗎?有沒有其他方法可以加權直方圖? sess = tf.Session() values = tf.random_uniform((1,50),10,20,dtyp

    1熱度

    1回答

    我創建了一個程序,需要用不同的輸入參數多次調用一個函數(lot !!)。 爲了加快速度,我多線程這是這樣的: std::vector< MTDPDS* > mtdpds_list; boost::thread_group thread_gp; for (size_t feat_index = 0; feat_index < feat_parser.getNumberOfFeat(); ++fe

    -1熱度

    1回答

    所以我想模擬一個名爲Tasep的一維物理模型。 我寫了一個代碼來模擬C++中的這個系統,但我絕對需要提升性能。 該模型非常簡單(下面的C++代碼) - 1和0的數組。 1代表顆粒並且0是無顆粒,意思是空的。一個粒子向右移動一個元素,速度爲1,如果該元素爲空。最後一個位置的粒子將以beta(比如0.3)的速度消失。最後,如果第一個位置是空的,則粒子將出現在那裏,速率爲alpha。 一個線程很容易,我