slurm

    1熱度

    1回答

    我只是將qos參數MaxTRESperuser設置爲cpu = 10用於測試目的,但slurm正在調度作業。 我用: sacctmgr modify qos normal maxtresperuser=cpu=1 ,我們可以查看 sacctmgr節目的QoS Name Priority GraceTime Preempt PreemptMode Flags UsageThres

    2熱度

    1回答

    我有權訪問由Slurm運行的集羣,其中每個節點都有4個GPU。 我有一個代碼需要8 gpus。 所以問題是我該如何請求每個節點只有4個gpus的集羣上的8個gpus? 所以這是我試圖通過sbatch提交作業: #!/bin/bash #SBATCH --gres=gpu:8 #SBATCH --nodes=2 #SBATCH --mem=16000M #SBATCH --

    1熱度

    1回答

    我在SLURM prolog腳本中運行如下命令: ifconfig,sminfo,但是這些命令未執行並返回錯誤:未找到命令並且如果檢查輸出文本時爲空輸出文件。如果我嘗試命令如:ls,hostname;他們工作得很好。 我試着手動執行腳本,它的工作和命令:sminfo,ifconfig運行良好。 什麼問題? 我的腳本: #!/bin/bash echo "==Pre job==:" work_

    1熱度

    1回答

    有沒有辦法找出工作被slurm取消的原因?我想區分資源限制因所有其他原因而受到影響的情況(如手動取消)。如果遇到資源限制,我也想知道哪一個。

    0熱度

    1回答

    我們試圖在我們的uni實驗室中使用slurm,但我們無法完全理解slurmUser的行爲。 例如: 如果我跑SRUN,而我登錄的用戶「acnazarejr」(srun -n1 id -a),那麼我希望是這樣的: uid=80000001637(acnazarejr) gid=80000000253(domain user) groups=80000000253(domain user),1001(

    0熱度

    1回答

    我剛從PBS切換到SLURM。原本我的腳本讀作: 嘗試將我的腳本從PBS更改爲SLURM。之前看起來是這樣: qsub -N $JK -e $LOGDIR/JK_MASTER.error -o $LOGDIR/JK_MASTER.log -v Z="$ZBIN",NBINS="$nbins",MIN="$Theta_min" submit_MASTER_analysis.sh 現在需要的是

    1熱度

    1回答

    服務器剛從CONDOR切換到SLURM,因此我正在學習並嘗試將提交腳本轉換爲SLURM。 我的問題是以下,我有兩個作業陣列。第二個依賴於第一個。從目前來看,我像下面 events1=$(sbatch --job-name=events --array=1-3 --output=z-events-%a.stdout myfirst.sh) jobid_events1=`echo ${events1

    0熱度

    1回答

    我想調整我的HPC集羣(我用Sparklyr),我試圖通過http://blog.cloudera.com/blog/2015/03/how-to-tune-your-apache-spark-jobs-part-2/收集指定的一些重要規格數量: 要希望可以讓所有這些更具體一些,下面是配置Spark應用程序以使用盡可能多的集羣作爲 的示例:想象一下,具有六個節點的羣集運行NodeManagers,

    2熱度

    1回答

    我想在大量的樣本上運行以下命令。 java -jar GenomeAnalysisTK.jar \ -R scaffs_HAPSgracilaria92_50REF.fasta \ -T HaplotypeCaller \ -I assembled_reads/{sample_name}.sorted.bam \ --emitRefCon

    0熱度

    1回答

    我正在使用NGS數據,最新的測試文件非常龐大。 通常我們的管道只使用一個節點,不同工具的輸出是./scratch文件夾。 僅使用一個節點對於當前海量數據集是不可能的。這就是爲什麼我想使用至少2個節點來解決問題,如速度,並不是所有的作業都提交等。 使用多個節點或甚至多個分區很容易 - 我知道如何使用哪個參數步。 所以我的問題是不是錯過參數,但背後SLURM的邏輯來解決以下問題有關I/O: 可以說我有