aleagpu

    0熱度

    1回答

    let sumModule = (new DeviceSumModuleF32(GPUModuleTarget.Worker(worker))).Create(2e2 |> int) let t = worker.Malloc([|1.0f;1.0f;1.0f;1.0f;|]) let q = sumModule.Reduce(t.Ptr,4) 沒有失敗,上面的代碼崩潰,最後一行每次運行

    0熱度

    2回答

    我們如何才能將具有多維度的數組複製到AleaGPU中的內核? 我們如何在內核中使用多維數組進行開發? Malloc似乎不接受它? double[,] inputs; double[,] dInputs1 = Worker.Malloc(inputs); // I get an error here var dOutputs1 = Worker.Malloc<double>(inputs1.Le

    0熱度

    1回答

    排序不是微不足道的實現,我無法在文檔或自動完成中找到該模塊。它不支持嗎?

    1熱度

    2回答

    我們如何使用AleaGpu釋放陣列的GPU內存? (在GPU卡上) 在函數/子裏面,如果我們想釋放數組dOutputs,dInputs的GPU內存,我們該怎麼做呢? 1 /志 「dOutputs 處置(); dInputs 處置();」。釋放GPU內存? 2 /是否存在用於GPU的「GC.Collect()」?有必要嗎 ? 3 /隨着AleaGpu,我們有一個命令來釋放GPUmemory? pri

    0熱度

    1回答

    如何在AleaGpu中使用10000行10000列(而不是行= 10和行= 5)的數組? private void button3_Click(object sender, EventArgs e) { var worker = Worker.Default; const int rows = 10; const int cols = 5; var rng

    0熱度

    1回答

    let absoluteSumModule = (new DeviceReduceModule<float32>(GPUModuleTarget.Worker(worker), fun a b -> a+b)).Create(128000) 我試過各種maxNumItems設置,但沒有mater它拋出相同的異常。與上次不同,我不知道這個錯誤甚至可能是什麼,所以我在這裏包括了整個轉儲。 Fail

    0熱度

    1回答

    我有幾個腳本,運行一段時間後,拋出內存異常Cuda。在他們的內部,我使用了預分配的數組,所以我沒有想到這會是一個問題。儘管如此,在將腳本轉換爲.fs文件並編譯它們之後,分析器對於此任務並不特別有用,並且cuda-memcheck工具6.5(36)在我使用它時拋出了CudaInterOp異常。 cuda-memcheck 7.0(40)實際上迫使我在GPU退出時重置PC。 我現在有點不確定要做什麼。

    2熱度

    1回答

    我試圖使用DeviceMapModule和DeviceMap2Module進行簡單的映射操作。 令我驚訝的是,它比手工編寫內核要慢2倍左右。 對於手寫內核,我沒有做任何特別的事情。我剛剛複製了入門Square內核並將其修改爲sigmoid。 下面是2個版本的代碼: 首先,慢版: type SigmoidModule(size) = inherit Module(size, size) /

    0熱度

    1回答

    是否需要處理Worker.Default或CUBLAS.Default? 我的CUDA代碼可以正常運行,但我得到下面的異常當程序退出: Got CUDA error CUDA_ERROR_INVALID_VALUE at System.Environment.GetStackTrace(Exception e, Boolean needFileInfo) at System.E

    4熱度

    1回答

    我一直在嘗試使用Alea的GPU寫在F#並行弗洛伊德 - Warshall算法,並立足自己的CUDA代碼中的另一個用戶這裏介紹 The Floyd-Warshall algorithm in CUDA 我寫的下面簡單的實現 type FWModule<'T>(target:GPUModuleTarget, tileDim:int) = inherit GPUModule(target)