1
因此,我花了幾個小時試圖弄清楚這一點,並希望得到任何幫助。在Slurm羣集上運行批處理作業
我所試圖做的是用SLURM --array0-654
我想每個作業步驟運行8個線程運行批處理作業。
我有權訪問集羣上的每個32個線程的11個節點,我似乎無法得到正確的SBATCH配置。它似乎要麼爲每個節點運行一個作業,要麼在所有節點上運行超過200個作業。
我試過了許多不同的配置,並想知道是否有人有一些建議。
因此,我花了幾個小時試圖弄清楚這一點,並希望得到任何幫助。在Slurm羣集上運行批處理作業
我所試圖做的是用SLURM --array0-654
我想每個作業步驟運行8個線程運行批處理作業。
我有權訪問集羣上的每個32個線程的11個節點,我似乎無法得到正確的SBATCH配置。它似乎要麼爲每個節點運行一個作業,要麼在所有節點上運行超過200個作業。
我試過了許多不同的配置,並想知道是否有人有一些建議。
從你的描述,你應該使用
--array 0-654
--ntasks 1
--cpus-per-task 8
但結局將取決於羣集配置(特別是與否的節點可以在節點之間共享的限制上作業的數量等存在)
你能寫出你試過的選項和結果嗎? –