我對集羣實現(「Beowulf集羣」)如何與MPI等通信協議相關有點困惑。需要使用OpenMPI之類的軟件組件來設置「羣集」?'羣集'軟件與MPI有何關係?
3
A
回答
3
正如你所知,一個集羣是一羣聯網在一起的計算機。當你有這樣的配置,您通常安裝和使用下列內容:
- MPI,進程間通信
- NFS,有一個網盤可見,並且共享給所有節點
- NTP,同步的節點的時間,以便您可以比較日誌事件和時間戳以從遠程節點引導節點,以便每個節點都重新啓動並保證良好且統一的安裝。
- 一組羣集實用程序,使您的生活更輕鬆,如分佈式ssh可同時在所有節點上執行相同的命令。
- 任務調度程序或隊列管理器(如Condor,LFS或其他)允許您優先處理作業提交併最終測量它們以進行限制/定價。
- 看門狗,所以如果卡住了,自動重啓一個節點。
- 爲UPS軟件控制
還有更多(所以在權力的長期損失的情況下自動關機)。所有這些都是MPI的完全補充。 MPI只是流程之間的溝通渠道。 MPI本身並不「製造集羣」。
1
正如您所述,MPI只會提供進程之間的通信。如果不會有多人使用集羣,那麼您確實不需要其他任何東西(除了在所有節點上啓動程序的一些腳本)。
但是,實際上我們很少有我們的個人集羣。那時你需要一個調度器。調度程序通常處理作業提交和資源分配,可能還會考慮優先級,用戶管理和其他事項,以使您的生活更輕鬆。
0
看看Oracle Grid Engine(nee Sun Grid Engine或CODINE)。
相關問題
- 1. MPI和集羣
- 2. AWS羣集上的MPI
- 3. F#+ MPI + MONO:集羣計算
- 4. 在集羣上測試MPI
- 5. 如何啓動IPython MPI羣集?
- 6. Hadoop集羣需求軟件/硬件
- 7. 使用R pheatmap軟件包時,有沒有辦法關閉集羣?
- 8. 啓動IPython筆記本MPI羣集
- 9. 編輯MPI羣集的/ etc/hosts
- 10. 在MPI羣集上運行C程序
- 11. 在lsf集羣上提交mpi作業
- 12. 用降雪初始化MPI集羣R
- 13. PBS集羣上的MPI Hello World
- 14. 在LAM/MPI羣集上安裝Rmpi
- 15. 是否有任何易於使用的羣集構建軟件?
- 16. Windows羣集 - 軟件的高可用性
- 17. 羣集的軟件管理工具
- 18. 構建集羣所需的軟件
- 19. Pax考試:提供與所有依賴關係的軟件包
- 20. 實體關係圖軟件
- 21. 關機集羣VS破壞集羣
- 22. 羣集kml文件與geoxml3
- 23. WestGrid中基於MPI羣集的並行計算(pbs文件)
- 24. Spark 2.0 - 如何獲取與羣集中心關聯的羣集ID
- 25. neo4j羣與不同終點的關係
- 26. 問題有關MPI
- 27. 關閉集羣與谷歌地圖API
- 28. Hadoop集羣與碼頭羣
- 29. 如何在R軟件包中包含所有軟件包依賴關係?
- 30. 關於elasticsearch集羣
很好的回答,謝謝! – EmpireJones