2015-02-04 73 views
0

我使用的是中間層3主機上了Ubuntu的14.04如下恢復工作正常,但在重新啓動所有物理主機後,所有預定作業都會丟失。 這很正常嗎?我期望動物園管理員將存儲當前作業,然後當系統需要重新啓動時,所有作業將在主引導後重新計劃。Mesos集羣不物理主機時重啓

更新: 我使用的是同一個節點上馬拉松和mesos,而我與運行標誌--zk

+0

您正在使用什麼調度程序? – KirkSpaziani

+0

@KirkSpaziani,我正在使用馬拉松 – kikicarbonell

+0

你能檢查動物園管理員的狀態嗎? – drexin

回答

0

馬拉松馬拉松的--zk並啓用--ha,馬拉松應存儲其ZK中的狀態並在重新啓動時恢復它,只要Mesos允許它使用相同的框架ID重新註冊。

但是,您還需要啓用Mesos註冊表(即使對於單個主服務器),以確保Mesos在主服務器故障轉移的情況下持久保存有關注冊了哪些frameworkIds的信息。這可以通過設置--registry=replicated_log(默認),--quorum=1(因爲您只有1個主設備)和--work_dir=/path/to/registry(存儲狀態的位置)來完成。

0

雖然你找到了解決辦法,我想更多地解釋這個問題:)

在官方文檔:http://mesos.apache.org/documentation/latest/slave-recovery/

請注意,如果從屬設備上的操作系統重新啓動,則主機運行的所有 執行程序和任務都會被終止,而不會在主機恢復時自動重新啓動 。

所以Mesos上的所有框架在重啓後都會被終止。重新啓動框架的一種方式是運行Marathon上的所有框架,這將管理其他框架並重新啓動它們。

但是,您需要在死亡時自動重新啓動Marathon。在你提到的數字海洋鏈接中,Marathon在init.d中安裝了腳本,因此它可以在重新啓動後重新啓動。否則,如果您通過源代碼安裝Marathon,則可以使用supervisord等工具來監控Marathon。