qsub

    5熱度

    2回答

    我有一個perl腳本,用於準備輸入二進制程序的文件並將二進制程序的執行提交給SGE排隊系統版本6.2u2。 通過-sync y選項提交作業,以允許父級perl腳本能夠使用waitpid函數監視提交作業的狀態。 這也非常有用,因爲向父Perl腳本發送SIGTERM會將此信號傳播給每個孩子,孩子們然後將這個信號轉發到qsub上,從而正常終止所有關聯的提交作業。 因此,能夠使用此-sync y選項提交作

    10熱度

    4回答

    我有一個產生數字的函數(神經網絡模型)。我希望使用PBS在帶有Torque的標準集羣上測試幾個參數,方法和不同的輸入(意味着數百次函數運行)。 注意:我嘗試了parallelpython,ipython等,並且從來沒有完全滿意,因爲我想要簡單一些。該集羣處於一個我無法改變的給定配置中,這樣一個集成python + qsub的解決方案肯定會使社區受益。 爲了簡化問題,我有一個簡單的函數,例如: im

    1熱度

    2回答

    一些短,大概愚蠢約PBS問題: 1 - 我提交使用 qsub job_file 是有可能提交一份工作文件中(子)的工作職位? 2 - 我有以下腳本: qsub job_a qsub job_b 對於推出job_b,這將是巨大的,有job_a結果完成之前。是否有可能設置某種障礙或某種解決方法,以便在job_a完成之前不會啓動job_b? 感謝

    8熱度

    2回答

    我有一個運行PBS Pro的64節點集羣。如果我提交了數百份工作,我可以馬上得到64份工作。這很好,除非所有64個作業幾乎都是I/O限制,並且正在讀/寫同一個磁盤。在這種情況下,我希望能夠繼續提交所有的工作,但是在給定的時間內有最多10個工作。是否有一個qsub的咒語可以讓我這樣做,而不需要對集羣的PBS服務器進行管理訪問?

    2熱度

    2回答

    我從qsub shell腳本調用了一些python腳本中的幾個unix命令和python,意圖在羣集上運行。問題在於,當腳本執行時,shell中的某些內容似乎會出錯,從而找不到存在的目錄和文件。例如,在qsub的.out輸出文件中,我看到以下錯誤: cd: /valid/dir/name: No such file or directory python valid/script/name.py

    0熱度

    1回答

    我目前正在使用ClusterVisionOS 3.1開發一個集羣。這將是我第一次使用集羣,所以我可能沒有嘗試過「明顯」。 我可以提交一個作業到羣集的「使用qsub」命令(這我得到正常工作) 但在一次提交多個作業時的問題開始。我可以寫一個腳本,一次發送它們,但是所有的節點都會佔用我的工作,並且有更多的人希望提交他們的工作。 所以這裏的交易: 32個節點(4個處理器/每個插槽) 的最好的事情是告訴羣集

    8熱度

    2回答

    我想通過Sun Grid Engine(現在是:Oracle Grid Engine?)上的qsub提交作業。我不希望使用-sync yes選項或qrsh,因爲我希望我的控制程序是單線程的,並且能夠一次啓動多個作業。這些選項會阻止我的控制程序的線程。 但是,我希望收到我啓動的進程的退出狀態。從手冊頁,似乎沒有辦法得到這個代碼沒有阻止我的線程。修改我打算將退出代碼打印到標準輸出的工作是否有任何方法可

    5熱度

    3回答

    我想在我發送到服務器的所有作業都完成時運行腳本。 例如,我送 ssh server "for i in config*; do qsub ./run 1 $i; done" 我找回啓動的作業清單。我想在服務器上自動啓動另一個腳本,以便在完成所有這些作業後處理這些作業的輸出。 我將不勝感激任何意見,這將有助於我避免以下不雅的解決方案: 如果我保存每個1000個作業標識的從上面呼叫一個單獨的文件,