sbatch

    0熱度

    2回答

    在SLURM,我可以很容易地在我的作業腳本指定日誌文件: #SBATCH --output=logs/output-%j #SBATCH --error=logs/error-%j 現在,我使用的是編程產生jobscript。每當我提交一份工作時,我都想將該工作記錄保存爲logs/jobscript-%j。 我該怎麼做?(主要難度似乎是%j。)

    1熱度

    1回答

    我的問題與this one類似,區別在於我的不同參數不是數字而是字符串。 如果我有一個以兩個字符串作爲參數的腳本(myscript.R):「text-a」,「text-A」。我對sbatch shell腳本是: #!/bin/bash #SBATCH -n 1 #SBATCH -c 12 #SBATCH -t 120:00:00 #SBATCH --partition=main #SB

    15熱度

    2回答

    我想了解SLURM的srun和sbatch命令之間的區別是什麼。我會對一般性解釋感到滿意,而不是針對以下問題的具體答案,但這裏有一些具體的混淆點,可以作爲一個起點,並提供我正在尋找的內容。 按照documentation,srun是用於提交作業,並sbatch是提交以便以後執行的工作,但實際的區別是我不清楚,他們的行爲似乎是相同的。例如,我有一個2個節點的集羣,每個節點有2個CPU。如果我連續5次

    0熱度

    1回答

    我必須使用sbatch在集羣上運行多個模擬。在一個文件夾,我必須要運行的Python腳本和文件與sbatch使用: #!/bin/bash -l #SBATCH --time=04:00:00 #SBATCH --nodes=32 #SBATCH --ntasks-per-core=1 #SBATCH --ntasks-per-node=36 #SBATCH --cpus-per-tas

    1熱度

    1回答

    當我向具有兩個GPU的節點提交帶選項--gres = gpu:1的SLURM作業時,如何獲得分配給作業的GPU ID?有沒有爲此目的的環境變量?我使用的GPU都是NVIDIA GPU。 謝謝。

    2熱度

    1回答

    我有我使用slurmsbatch運行Python腳本提交: sbatch batch.py 當我這樣做,因爲我認爲這事情不正常工作,batch.py過程中不繼承權的環境變量。因此,不是從sbatch命令運行的地方運行batch.py,而是從其他地方運行(/我相信)。我設法做一個bash腳本包裹python腳本來解決這個問題: #!/usr/bin/env bash cd path/to/sc

    1熱度

    2回答

    我發現這讓我在這似乎不過工作我仍然不確定,如果我完全理解爲什麼,所以這個問題的腳本到一些非常類似的問題.. 我的問題(例如):在3個節點,我想在每個節點上運行12個任務(總共36個任務)。另外每個任務都使用OpenMP並應使用2個CPU。在我的情況下,一個節點有24個CPU和64GB內存。我的腳本是: #SBATCH --nodes=3 #SBATCH --ntasks=36 #SBATCH

    2熱度

    1回答

    我正在使用羣集來運行我的代碼。我使用runm文件在集羣上運行我的代碼。 RUNM腳本如下:今天 #!/bin/sh #SBATCH --job-name="....." #SBATCH -n 4 #SBATCH --output=bachoutput #SBATCH --nodes=1-1 #SBATCH -p all #SBATCH --time=1-01:00:00 matlab

    0熱度

    1回答

    當我們通過sbatch提交作業時,pid按增量順序給出的作業。根據我的觀察,這個命令從1開始。 sbatch -N1 run.sh Submitted batch job 20 //目標是如果可能,更改提交的批作業的ID。 [Q1]例如,在slurm下有一個正在運行的工作。當我們重新啓動節點時,作業是否繼續運行?並且它的pid是否更新或保持原樣? [Q2]是否可以使用集羣所有者想要提供的唯一

    -1熱度

    1回答

    我一直在拉我的頭髮大約一週,以獲得sbatch作業腳本提交到多個節點。我有兩個帶有(2)插槽(12)內核/插槽(2)線程/內核的計算節點。 我有一個簡單的c程序,它可以計算斐波那契數列(沒有多線程或mpi只是一個單進程單核程序)。 現在我有腳本fib.sh其中包含「SRUN ./fibonacci &」的30行,我做./fib.sh 1日12個工作在第一節點1時運行時,另一節點2和未來12運行休息