我想運行一個機器上的多個工人守護進程。根據damienfrancois's回答what is the minimum number of computers for a slurm cluster它可以完成。問題是目前我能夠在一臺機器上只執行一個工作守護進程。例如 當我運行 sudo slurmd -N linux1 -cDvv
sudo slurmd -N linux2 -cDvv
lin
我有幾個腳本發送到使用sbatch訪問的集羣。但是,我想暫停這些運行腳本,而不必取消他們的工作,因爲他們已經運行了一段時間了。 有沒有辦法保持/暫停當前運行的作業而不取消他們已經完成的作業? 我the following website發現一個可以暫停他們: To pause a particular job:
scontrol hold <jobid>
不過,我還是有點不確定如何使它與工