我使用的是中間層3主機上了Ubuntu的14.04如下恢復工作正常,但在重新啓動所有物理主機後,所有預定作業都會丟失。 這很正常嗎?我期望動物園管理員將存儲當前作業,然後當系統需要重新啓動時,所有作業將在主引導後重新計劃。Mesos集羣不物理主機時重啓
更新: 我使用的是同一個節點上馬拉松和mesos,而我與運行標誌--zk
我使用的是中間層3主機上了Ubuntu的14.04如下恢復工作正常,但在重新啓動所有物理主機後,所有預定作業都會丟失。 這很正常嗎?我期望動物園管理員將存儲當前作業,然後當系統需要重新啓動時,所有作業將在主引導後重新計劃。Mesos集羣不物理主機時重啓
更新: 我使用的是同一個節點上馬拉松和mesos,而我與運行標誌--zk
馬拉松馬拉松的--zk
並啓用--ha
,馬拉松應存儲其ZK中的狀態並在重新啓動時恢復它,只要Mesos允許它使用相同的框架ID重新註冊。
但是,您還需要啓用Mesos註冊表(即使對於單個主服務器),以確保Mesos在主服務器故障轉移的情況下持久保存有關注冊了哪些frameworkIds的信息。這可以通過設置--registry=replicated_log
(默認),--quorum=1
(因爲您只有1個主設備)和--work_dir=/path/to/registry
(存儲狀態的位置)來完成。
雖然你找到了解決辦法,我想更多地解釋這個問題:)
在官方文檔:http://mesos.apache.org/documentation/latest/slave-recovery/
請注意,如果從屬設備上的操作系統重新啓動,則主機運行的所有 執行程序和任務都會被終止,而不會在主機恢復時自動重新啓動 。
所以Mesos上的所有框架在重啓後都會被終止。重新啓動框架的一種方式是運行Marathon上的所有框架,這將管理其他框架並重新啓動它們。
但是,您需要在死亡時自動重新啓動Marathon。在你提到的數字海洋鏈接中,Marathon在init.d中安裝了腳本,因此它可以在重新啓動後重新啓動。否則,如果您通過源代碼安裝Marathon,則可以使用supervisord等工具來監控Marathon。
您正在使用什麼調度程序? – KirkSpaziani
@KirkSpaziani,我正在使用馬拉松 – kikicarbonell
你能檢查動物園管理員的狀態嗎? – drexin