hpc

    1熱度

    2回答

    我發現這讓我在這似乎不過工作我仍然不確定,如果我完全理解爲什麼,所以這個問題的腳本到一些非常類似的問題.. 我的問題(例如):在3個節點,我想在每個節點上運行12個任務(總共36個任務)。另外每個任務都使用OpenMP並應使用2個CPU。在我的情況下,一個節點有24個CPU和64GB內存。我的腳本是: #SBATCH --nodes=3 #SBATCH --ntasks=36 #SBATCH

    -2熱度

    1回答

    我已經建立了一個具有1個頭節點和3個計算節點的小型集羣。我的客戶機是用於提交工作簿卸載作業的Windows 2016 Server。我的問題 - HPC非常緩慢;如果我在本地計算機上運行作業,則運行速度比HPC羣集上的速度快10倍左右!我節點的配置如下: Headnode:2vCPU和8GB內存 計算節點:1vCPU和4GB內存的每個 我有一個可疑的問題可能是與節點之間的通信網絡。或者完全不同的東

    0熱度

    1回答

    請參考下面的收集代碼: from mpi4py import MPI comm = MPI.COMM.WORLD size = comm.Get_size() rank = comm.Get_rank() stat = MPI.Status() message = (rank)**2 print "Before Gather ",rank, message message =

    0熱度

    1回答

    我開展圖搜索算法的研究。在這項研究中,爲了比較兩種算法的運行時間性能,可靠地(即可重新生成)測量單線程程序的運行時間的能力是極其重要的。運行時間是在程序內部測量的(用C++編寫的),並且不包括任何對二級存儲器的訪問(只發生在初始輸入階段)。我曾經有權訪問真實(即非雲)HPC羣集的專用節點。我記得,當我在這樣一個節點上運行程序兩次(使用相同的輸入)時,我得到的時間測量結果只有百分之幾的不同。問題是:

    0熱度

    1回答

    我正在使用HPC Pack羣集。我想使用HPC包作業管理器來運行我的任務。 我應該在哪裏保存.exe文件?

    1熱度

    1回答

    我正在使用HPC羣集。我成功創建了本地openmpi_gpu模塊(使用intel17.2和cuda 8.0編譯)。我所做的是,存儲cuda_17.2.lua文件目錄 ${HOME}/modulefiles/Core/openmpi_gpu/ 並經過 module use $HOME/modulefiles/Core 我可以通過鍵入module avail看到新的模塊「openmpi_gpu

    2熱度

    1回答

    我正在使用OpenCl開展我的項目。爲了提高我的算法的性能,是否可以管道一個內核?如果一個內核由多個步驟組成,讓我們說A,B,C,我希望A在完成它的部分並將它傳遞給B時接受新數據。我可以在它們之間創建通道,但是我不知道如何執行它詳細。 我可以在.cl文件中寫入A,B,C(3個內核)嗎?但如何入列NDRange? 我正在使用Altera SDK進行FPGA HPC開發。 謝謝。

    0熱度

    1回答

    當I型: mpiexec -n 12 ./Main 我得到的消息:使用具有1線/節點12個節點 ,共計12個處理 我想我的整個的將一組內核識別爲1節點並運行其中的所有12個線程,而不是將12個獨立作業發送到12個內核中的每一個。

    3熱度

    1回答

    我在想,是否有一種簡單的方法可以在每個區域設置一個全局變量的副本,以便以後每個區域設置都可以直接訪問其本地副本而不是訪問原始變量存儲在locale0中? 感謝

    0熱度

    1回答

    我正嘗試將數組發送到超立方體系結構中的不同處理器。問題是它要麼不發送給所有的處理器,要麼發送給錯誤的處理器。當我嘗試發送一個整數時,它可以正常工作。 下面是代碼: void hypercube(int d,int my_id,int X[]){ mask = (int)pow((double)2,d)-1; for(i = d-1;i>=0;i--){ //printf("