2
我想查看集羣上運行的所有最新作業(完成,失敗和正在運行)。我還希望看到每個作業1個條目。執行sacct
會爲每個作業重新生成3行,其格式爲State: FAILED, FAILED, COMPLETED
。這是什麼意思,我如何查看我想看到的實際信息?SLURM中的作業狀態
我不明白true
的JobName
是什麼意思。
這裏是輸出的副本:
JobID JobName Partition Account AllocCPUS State ExitCode
------------ ---------- ---------- ---------- ---------- ---------- --------
2160852 R interact cluster_u+ 2 COMPLETED 0:0
2160864 R interact cluster_u+ 2 COMPLETED 0:0
2161424 R interact cluster_u+ 2 COMPLETED 0:0
2161430 R interact cluster_u+ 0 CANCELLED+ 0:0
2161431 R interact cluster_u+ 2 COMPLETED 0:0
2161668 R interact cluster_u+ 2 COMPLETED 0:9
2161682 myjob+ general cluster_u+ 2 FAILED 1:0
2161682.bat+ batch cluster_u+ 1 FAILED 1:0
2161682.0 true cluster_u+ 1 COMPLETED 0:0
2161683 myjob+ general cluster_u+ 2 FAILED 1:0
2161683.bat+ batch cluster_u+ 1 FAILED 1:0
2161683.0 true cluster_u+ 1 COMPLETED 0:0
提交腳本(注%>由R中包BatchJobs處理在<%該值):
#!/bin/bash
#SBATCH -J <%= job.name %> # name of the job
#SBATCH -p general
#SBATCH --mem <%= resources$memory %> # Memory requirements in Kbytes
#SBATCH -o ./logs/<%= job.name %>_log.txt # Memory requirements in Kbytes
eval "R --vanilla --slave < <%= rscript %>"
我只是把一個輸出的副本,謝謝! – Alex
另外,什麼是「工作步驟」? – Alex
廣義上講,如果你的工作由幾個命令組成,每一個都是一個工作步驟。 – damienfrancois