0

我對使用StarCluster和SGE有點新。我想知道監控「集羣性能」的最佳做法是什麼,即確定集羣可以在某個單位時間內運行多少個某個作業。我熟悉qstat命令,但只顯示每個作業的狀態。我想我的用例是提交X個工作,並知道完成所有X需要多長時間。有沒有一個容易的方式來做到這一點,或者我必須寫一個scipt來做到這一點?監控StarCluster/Sun Grid Engine集羣性能

現在我正在爲每個實例使用Ubuntu 12.04。

非常感謝!

+0

你的問題對我來說不太清楚。你想用這種監控做什麼?根據「性能」添加和刪除節點?如果是這樣,您應該查看StarCluster負載平衡。 – 2014-08-29 12:53:24

+0

只是想簡單估計一組作業的執行時間,並嘗試使用羣集的不同配置來查看最有效的配置。所以,我真的只是想要有一套工作,並知道他們什麼時候完成。謝謝 – user2439313 2014-08-30 04:13:13

回答

0

這樣一個簡單的bash腳本+時間命令就足夠了。

lines=999 
while [ $lines -ne 0 ]; do 
    sleep 1; 
    lines=`qstat -u "*" | wc -l`; 
    done; 

只要隊列不爲空,此腳本就會循環。如果你打電話給你的腳本「queue_watch.sh」,然後開始你的工作,然後運行命令

time bash queue_watch.sh 

而且應該這樣做。