pbs

    0熱度

    1回答

    我請求14個處理器從一個一個(每個都有32)所示: #PBS -l nodes=1:ppn=14 #PBS -l walltime=12:00:00 而且具有較低的ppn它幾乎總是工作,但一旦我的數字高於14- ish,工作開始執行並立即終止。 tracejob是奇無益: tracejob 14753.hpc2 Job: 14753.hpc2 01/21/2017 11:12:36

    0熱度

    1回答

    我們使用的是轉矩PBS,我們必須使用qmgr更新許多節點的參數。 對於每個正在討論的節點,手動調用類似'set node n44 properties- = unneeded_pa​​ram'的方法。 現在,我該如何列出具有指定屬性的所有節點?

    4熱度

    1回答

    我正在嘗試提交依賴於數組完成的轉矩作業。 FIRST=`qsub -q hep -t 1-5 foo.sh` qsub -q hep -W depend=afterok:$FIRST bar.sh 第一份工作陣列提交併完成得很好,但第二個作業bar.sh只抱下去。 如果我從第一個參數中刪除數組選項,第二個作業將按計劃成功,但這並不能真正解決問題。 有從3年前類似的線程,但它似乎沒有實際的解決方案:

    2熱度

    2回答

    我希望能夠通過腳本輕鬆更改多少個nodes,ppn等提交給qsub。也就是說,我想運行的財產以後這樣的: qsub script.sh --name=test_job --nodes=2 --ppn=2 --arg1=2 有了這樣的腳本如下: #/bin/bash #PBS -N ${NAME} #PBS -l nodes=${NODES}:ppn=${PPN},walltime=${WA

    0熱度

    1回答

    如何分析這些日誌條目,我想了解這些日誌條目的格式是什麼? 1) PBS_Server;LOG_ERROR::Cannot assign requested address (99) in send_job, send_job failed to d23818f7 port 15002 2) pbs_mom;LOG_ALERT::mom_server_valid_message_source, ba

    0熱度

    1回答

    我正在運行一個bash腳本,它在基於Linux的羣集上多次提交一些pbs作業。每個提交調用Matlab,讀取一些數據,執行計算,並將結果寫回到我的目錄。 這個過程沒有任何例外地正常工作。對於一些計算,m文件開始加載所有內容,而不是執行計算,但在將結果打印到標準輸出時,Job終止。 pbs的日誌文件顯示無錯誤消息,matlab顯示無錯誤消息。代碼在我的電腦上完美運行。我沒有想法。 如果有人想知道我能

    1熱度

    1回答

    我想在mpi4py python腳本上運行16個實例:hello.py。我存儲在這種s.txt 16個命令: python /lustre/4_mpi4py/hello.py > 01.out 我在克雷集羣通過這樣aprun命令提交此: aprun -n 32 sh -c 'parallel -j 8 :::: s.txt' 我的目的是運行那些每蟒蛇工作8該腳本運行超過3小時,並且沒有創建

    1熱度

    1回答

    我是新來的並行計算,我無法理解PBS系統的使用。我已成功安裝SLURM並設置處理節點。但無法理解我如何在多個節點之間分配任務。 有很多簡單的例子,但他們只是運行簡單的「Hello World」程序,這就是全部。 考慮下面的例子,我在網上找到了。 #!/bin/bash #SBATCH -N 4 #SBATCH -c 1 #SBATCH --time=0-00:15:00 # 30 minu

    1熱度

    2回答

    我在超級計算羣集上有一個帳戶,我在其中安裝了一些軟件包。 「pip安裝 - 用戶keras」。 當使用qsub將作業提交到隊列時,我嘗試通過設置「export PYTHONPATH = $ PYTHONPATH:[$ HOME] /。local/lib/python2.7/site來確保系統可以看到我的本地包 - 包裝/角落「。 但是,生成的日誌文件仍然抱怨沒有名爲keras的包。我怎樣才能確保系

    0熱度

    2回答

    我試圖生成一個系統,允許我檢查多個作業是否已完成在羣集上運行。 此bash的代碼應工作要等到所有的PBS的工作已經完成: #create the array ALLMYJOBS=() # loop through scripts, submit them and store the job IDs in the array for i in 1 2 3 4 5 do ALLMYJO