2009-12-06 172 views
5

我正試圖解決我們是否應該在工作中嘗試使用Condor或Sun Grid Engine(或可能是其他方法)。Condor,Sun Grid Engine或其他東西?

我們經常有很多未使用的WinXp工作站。希望我們可以使用LAN喚醒,運行我們所有的工作,然後自動關閉。我們主要運行Matlab,Java或Python仿真來進行monte-carlo或參數探索。

由於我對Condor的知識有限,聽起來像使用vm universe可能是一種快速處理快照而不必修改現有代碼的便捷方式。

SGE還是別的什麼比禿鷹更適合這種工作?

回答

3

我會從Condor開始。它對Windows有很好的支持,而且當某些機器上的作業可以運行時,新版本內置支持以非常可配置的方式發送喚醒喚醒功能。它也可以根據用戶定義的策略關閉機器。

3

對於專用硬件,我會使用Grid Engine。

對於可能正在使用的機器上的時鐘週期清除,我會去Condor。

對於固定期間(例如過夜和週末)有專門訪問權限的硬件,我可能仍然會使用Condor,但可以說服自己使用Grid Engine。

0

我只試過Condor,試圖建立它是一種痛苦。如果你需要所有的時鐘週期,你可以完全利用,與Condor一起。

我正要試試SGE,我會告訴你它是怎麼回事。然而在我的公司裏,人們有設置SGE的經驗,所以我可能會說SGE更容易。

1

最近我不得不選擇condor和SGE作爲客戶項目。我是有利於SGE(因爲我更熟悉的環境),但神鷹終於贏了,因爲:

  • 客戶基礎設施的Windows導向,和SGE解決方案需要一個Unix或Linux機器的中央管理器,+在計算安裝MS服務UNIX主機上的Windows神鷹
  • 支持和安裝過程就簡單多了。

但是,您不能在Windows上使用Condor最有趣的功能:檢查點不可用,也不能使用Condor特定的IO。我沒有使用VM Universe,因此我無法對此方面發表評論。

4

SGE不是真的是支持窗口。它附帶all kinds of caveats and missing bits on Windows

現在我已經運行多年神鷹池,這是一個極好的HTPC設置兩個週期竊取和專用的,永遠在線的硬件,在Linux和Windows機器。最近添加的Rooster daemon可讓您在各作業週期之間讓機器進入睡眠狀態,並在池中出現新作時將其喚醒。他們也有一個積極和非常有幫助的支持社區。點檢是Windows上唯一不可用的Condor功能。其他一切都在那裏。隨着VM Universe的增加,點校驗越來越少用。真的:要成功使用點檢查,您需要能夠重新鏈接整個代碼堆棧。所以,如果你正在運行Matlab作業,即使在Linux上,檢查點也不可能實現。

如果您有關於讓Condor在Windows上運行的具體問題,我很樂意回答他們,分享我的經驗。我在全球的4個游泳池中運行Condor,在所有游泳池中共有大約1500臺專用機器,並且大約有1000臺左右的用戶可以隨時捐贈的臺式機器。

0

SGE不存在......它是OGE,而且非常昂貴。跟Condor一起去吧。