2011-08-25 40 views

回答

3

正如你所知,一個集羣是一羣聯網在一起的計算機。當你有這樣的配置,您通常安裝和使用下列內容:

  • MPI,進程間通信
  • NFS,有一個網盤可見,並且共享給所有節點
  • NTP,同步的節點的時間,以便您可以比較日誌事件和時間戳以從遠程節點引導節點,以便每個節點都重新啓動並保證良好且統一的安裝。
  • 一組羣集實用程序,使您的生活更輕鬆,如分佈式ssh可同時在所有節點上執行相同的命令。
  • 任務調度程序或隊列管理器(如Condor,LFS或其他)允許您優先處理作業提交併最終測量它們以進行限制/定價。
  • 看門狗,所以如果卡住了,自動重啓一個節點。
  • 爲UPS軟件控制

還有更多(所以在權力的長期損失的情況下自動關機)。所有這些都是MPI的完全補充。 MPI只是流程之間的溝通渠道。 MPI本身並不「製造集羣」。

+0

很好的回答,謝謝! – EmpireJones

1

正如您所述,MPI只會提供進程之間的通信。如果不會有多人使用集羣,那麼您確實不需要其他任何東西(除了在所有節點上啓動程序的一些腳本)。

但是,實際上我們很少有我們的個人集羣。那時你需要一個調度器。調度程序通常處理作業提交和資源分配,可能還會考慮優先級,用戶管理和其他事項,以使您的生活更輕鬆。