0
我有權訪問MPI羣集。它是一個純淨,乾淨的局域網集羣,沒有SLURM或安裝了OpenMP,mpicc,mpirun之外的其他東西。我有sudo權利。可訪問和配置的MPI節點全部列於/etc/hosts
。我可以編譯和運行MPI程序,但是如何獲取有關MPI集羣能力的信息:總體內核可用性,處理器信息,總內存,當前正在運行的任務?如何列出MPI中每個節點的可用資源?
一般我搜索模擬sinfo
和squeue
這將工作在MPI環境?
首先將只看集羣的文件運行它。如果您不知道它在哪裏,或者它不存在,請詢問您的系統管理員和/或支持團隊......或者,也許這個問題是一個通用問題?在這種情況下,請更具體地說明您想要獲得什麼,以及您想要/可以使用哪些工具。 – Gilles
你可以更清楚你的問題嗎?當你定義它時,我看不出問題在哪裏。例如,爲什麼你不能使用'sinfo'或'squeue'(我可以假設,但它只是一個假設)?您也可以檢查便攜式硬件位置('hwloc')(如果您還沒有檢查),但由於我無法理解您的問題,所以我無法確定答案。 – Angelos