我正在尋找解決方案來運行大量任務並監視羣集上的狀態。在羣集上運行大量任務
詳細說明:每個任務由包含docker的每個進程組成(每個進程是docker run命令)。所有進程必須在同一臺服務器上運行。
我們正在討論的任務數量是一次突發數百個任務。
我已經研究過基於Mesos幾種解決方案,所有的人:
- 的Chronos - 似乎將高負載下,在任何情況下動搖更針對經常性(的cron)作業。雖然我需要一次性(重)工作。
- 自定義Mesos FW - 似乎爲我的需求低層次將需要我編寫調度和重試機制,我會保存這是最後的手段。
- Aurora - 這看起來很有前途,因爲每個任務都在同一個節點上運行,並由多個進程組成。雖然我在這裏錯過了一些,但Aurora似乎無法作爲單個作業的一部分運行多個任務。由於我的任務都與不同的輸入類似,我可以使用包含多個(比如400個)實例的單個作業,每個任務的第一個進程(其作用是從S3下載輸入)可以根據實例ID下載不同的集合。這給我帶來了另一個問題:我找不到在.aurora文件中使用{{mesos.instance}}的示例,任何人都可以給我一個例子嗎?
感謝所有的魚人
首先,謝謝 至於Marathon,我知道它是Mesos的一種init.d。 我不是在尋找一種服務,而是在尋找和應用程序。所以我認爲它不適合。 –
同意,只要記住,如果它總是需要少量的實例運行,然後在某些事件中爆發(即增加實例的數量),那麼它可能也很有趣。 – js84