pbs

    1熱度

    1回答

    所以,我需要將計算密集型工作(深度神經網絡訓練)提交到一個扭矩集羣,這個集羣會佔用計算時間,而且我需要每幾分鐘交換幾個大浮點數組因爲節點需要在最新版本的神經網絡上工作以訓練它。 我想知道是否有任何良好的溝通選擇,至少要告訴每個活躍的工作姐妹工作'ips,所以它可以連接到他們通過tcp。節點無法訪問互聯網,我們無法在作業提交服務器上運行守護進程。 ,我看到的唯一的選擇是: 一些消息傳遞轉矩選擇(我是

    1熱度

    1回答

    我有一個簡單的C++代碼,它使用Intel的TBB在使用PBS的集羣上運行腳本列表。我想確認我正在按照預期使用所有內核。每個節點有16個核心。我已經創建了腳本來花費不同的時間,以便如果列表平均分配,我將擁有空閒內核。如果核心變得可用時列表被分開,我應該沒有空閒內核。該代碼似乎在單個節點上正常工作,但對多個節點不起作用。 我想要的東西類似於echo $HOSTNAME除了核心。谷歌使我失敗併產生了回

    0熱度

    1回答

    將一些數據寫入使用PBS的羣集上的MPI文件時遇到很大麻煩。這裏是簡單的問題模擬程序的例子。 #include <mpi.h> #include <sys/types.h> #include <sys/stat.h> #include <unistd.h> #include <iostream> #include <fstream> #include <string> #inc

    2熱度

    1回答

    我有一個bash腳本,它執行一些操作,最後我希望腳本刪除包含它的文件夾。 所以我把在腳本的末尾以下命令 olddir=`pwd` cd .. rm -rf "$olddir" 該文件夾的內容被刪除,但該文件夾不,我得到以下錯誤 rm: cannot remove `folder': Directory not empty 的腳本由稱爲一個pbs腳本也包含在同一個文件夾中。 問題是什麼?

    1熱度

    1回答

    PBS排隊系統有兩種選擇(我知道)與多個進程有關。這是腳本中的相關行: #PBS -l nodes=1:ppn=1 我總是隻使用一個進程,並且這很好。但是,爲了加快速度,我重寫了腳本以使用多個進程。這與正常桌面上的測試用例(沒有PBS)正常工作,現在我想使用大型計算機(與PBS)。我如何確保使用正確的PBS設置?我是否需要更改節點或ppn?我不想隨便嘗試一些東西,因爲我不想搞亂其他人的工作。

    0熱度

    1回答

    我使用的是PBS排隊系統和使用的qsub -v 「輸入= myinputfile」 script.job 這與下面的bash jobscript #PBS -l nodes=1:ppn=1 #PBS -l walltime=1:30:00 ./aprogram $input 提交作業除了如果我運行作業,更改輸入文件中的某些內容而不重命名並在其後不久重新運行作業之外,程序程序獲取的輸入文件仍

    1熱度

    1回答

    有沒有辦法限制直接運行腳本的用戶的cpus和內存,但允許更多的作業提交cpus和內存? 我在Ubuntu 14.04服務器上運行轉矩/ pbs,並希望允許8 cpu和16 GB RAM的「正常」使用,其餘部分將專用作羣集的「媽媽」資源。正常的cgroups/cpuset配置也會限制正在運行的作業。

    1熱度

    1回答

    我正在編寫一個應用程序來測試pbs_connect()是否正在工作。這裏是我的代碼: #include <stdio.h> #include "/usr/include/torque/pbs_ifl.h" #include "/usr/include/torque/pbs_error.h" #include <pbs_config.h> #include "libpbs.h" in

    1熱度

    1回答

    我試圖在使用MPI的集羣上運行作業(python代碼)。每個節點上有63GB的可用內存。 當我在一個節點上運行它,我指定與(只有相關的參數在這裏列出)PBS參數: #PBS -l mem=60GB #PBS -l nodes=node01.cluster:ppn=32 time mpiexec -n 32 python code.py 比工作得很好。 由於PBS手冊頁說:mem是每整個作業

    1熱度

    1回答

    例如,我有一個文件/家庭/用戶/節點,其中包含: node1 node2 node3 node4 ... 當我嘗試提交作業,如: qsub -v PBS_NODEFILE=/home/user/nodes -l nodes=2 這是否意味着PBS將從/home/user/nodes列表中選擇2個節點?我嘗試過,但事實並非如此。它仍然選擇$ PBS_HOME/server_priv/