2013-08-12 30 views
0

我想分配過程在每個節點有8個核心的hpc,我也有一個2節點的分區。hpc作業分配與salloc&srun

我已經這樣做了CSH測試腳本:

#!/bin/tcsh 
foreach i (`seq 30`) 
    srun csh -c "echo 'running${i} into:'; hostname; sleep 10;echo 'end ${i}'" & 
end 
echo "waiting for jobs completion" 
wait 

而且我想與salloc運行:

salloc -N2 -p mypartition testsalloc.sh 

腳本啓動30個進程同時,當我預計,16後發射的,有14人排隊。

這種行爲可能與salloc和srun有關嗎?

回答

1

您也可以使用sbatch而不是salloc和你的原劇本本來最有可能給出預期的結果

0

最後,我已經找到了解決方案只增加這個PARAMS到SRUN命令:

srun --ntasks=1 --exclusive ....