2016-08-17 32 views
0

我有權訪問MPI羣集。它是一個純淨,乾淨的局域網集羣,沒有SLURM或安裝了OpenMP,mpicc,mpirun之外的其他東西。我有sudo權利。可訪問和配置的MPI節點全部列於/etc/hosts。我可以編譯和運行MPI程序,但是如何獲取有關MPI集羣能力的信息:總體內核可用性,處理器信息,總內存,當前正在運行的任務?如何列出MPI中每個節點的可用資源?

一般我搜索模擬sinfosqueue這將工作在MPI環境?

+0

首先將只看集羣的文件運行它。如果您不知道它在哪裏,或者它不存在,請詢問您的系統管理員和/或支持團隊......或者,也許這個問題是一個通用問題?在這種情況下,請更具體地說明您想要獲得什麼,以及您想要/可以使用哪些工具。 – Gilles

+0

你可以更清楚你的問題嗎?當你定義它時,我看不出問題在哪裏。例如,爲什麼你不能使用'sinfo'或'squeue'(我可以假設,但它只是一個假設)?您也可以檢查便攜式硬件位置('hwloc')(如果您還沒有檢查),但由於我無法理解您的問題,所以我無法確定答案。 – Angelos

回答

2

總核心可供選擇: 總內存: 你可以嘗試使用便攜式硬件局部性hwloc看到硬件拓撲並獲得總核心和總內存信息。 此外,您可以使用lscpucat /proc/cpuinfo

當前正在運行的任務獲取CPU信息: 您可以從IMB(自由) 選項的nmon-t報告頂部行走過程中使用的監控軟件nmon(如top命令) 。您可以使用nmon在線或離線模式。

下面的例子是從IMB developerWorks

nmon -fT -s 30 -c 120

越來越一個 「快照」,每隔30秒,直到它得到120個快照。然後你可以檢查輸出。

如果沒有-f,你會看到結果住

相關問題