2014-06-16 82 views
2

我有已完成工作的ID。如何檢查其詳細信息,如執行時間,分配的節點等?我記得SGE有一個命令(qacct?)。但是我找不到PBS或Torque。謝謝。如何獲取完成的PBS或扭矩作業的信息?

+0

如果PBS與Moab集成,我可以使用'checkjob'命令獲取工作信息。如果Moab沒有整合,我仍然想知道如何去做。 – user3282611

回答

0

現在,在TORQUE中得到這個的唯一方法是查看會計日誌。您可以grep的作業id並查看作業的會計記錄,這是這樣的:

04/30/2014 15:20:18;Q;5000.bob;queue=batch 04/30/2014 15:33:00;S;5000.bob;user=dbeer group=dbeer jobname=STDIN queue=batch ctime=1398892818 qtime=1398892818 etime=1398892818 start=1398893580 [email protected] exec_host=bob/0 04/30/2014 15:36:20;E;5000.bob;user=dbeer group=dbeer jobname=STDIN queue=batch ctime=1398892818 qtime=1398892818 etime=1398892818 start=1398893580 [email protected] exec_host=bob/0 session=22933 end=1398893780 Exit_status=0 resources_used.cput=00:00:00 resources_used.mem=2580kb resources_used.vmem=37072kb resources_used.walltime=00:03:20

不幸的是,直接做到這一點,你必須有root權限。爲了解決這個問題,可以使用pbsacct等工具來幫助您更好地瀏覽。 pbsacct是pbstools軟件包的一部分,這是該鏈接帶您的位置。

0

對於扭矩,您可以使用「tracejob」命令至少檢查一部分信息。

正式文件:

http://docs.adaptivecomputing.com/torque/Content/topics/11-troubleshooting/usingTracejobToLocateFailures.htm

有一件事你應該注意的是,這個工具是一個分析日誌提供了方便。默認情況下,它只會檢查最後一天。請務必閱讀「-n」選項的文檔。

+1

歡迎來到Stack Overflow! Stack Overflow強烈建議您不要使用鏈接回答。相反,[最好](http://meta.stackoverflow.com/q/8259)在這裏包含答案的基本部分,並提供供參考的鏈接。您可以通過給出'tracejob'命令的明確示例來改進這個答案,顯示典型輸出的樣本。 – drs

+0

這個答案看起來不僅僅是一個鏈接給我。它告訴工具是什麼,並添加關於使用它的其他建議。 –

2

由於工作需要會計的root訪問權限,查看已完成的作業,或羣集管理員已經安裝pbstools(包括了用戶的控制),我發現,最容易做的事情是把一個

tracejob $PBS_JOBID 

在提交腳本的最後一行。如果調度程序是MAUI,那麼checkjob -vv $PBS_JOBID是另一種選擇。這些命令可能會被重定向到一個單獨的OUTFILE:

tracejob $PBS_JOBID > $PBS_O_WORKDIR/$PBS_JOBID.tracejob 

也應儘可能有這個運行作爲用戶收尾腳本,使其從工作到工作更具重用性。

相關問題