1
我正在處理批處理問題。解決方案需要處理失敗的硬件。Gridgain故障轉移的主(發件人)節點
有主節點(它啓動任務執行)和執行作業的工作節點。我知道工作節點的故障轉移如何工作,但我找不到有關主節點故障轉移的任何信息。只要主節點啓動任務失敗,整個任務就會被取消。
有什麼辦法可以完成任務處理呢?
你能否提出實現主節點故障切換的最佳方式?
親切的問候, 庫巴
我正在處理批處理問題。解決方案需要處理失敗的硬件。Gridgain故障轉移的主(發件人)節點
有主節點(它啓動任務執行)和執行作業的工作節點。我知道工作節點的故障轉移如何工作,但我找不到有關主節點故障轉移的任何信息。只要主節點啓動任務失敗,整個任務就會被取消。
有什麼辦法可以完成任務處理呢?
你能否提出實現主節點故障切換的最佳方式?
親切的問候, 庫巴
每當你的主節點死了,基本上就沒有人來執行的MapReduce任務的的「減少」的一步。
有幾種方法可以嘗試減輕這個問題:
保存使用GridCheckpointSpi(GridTaskSession.saveCheckpoint(..)API)中間檢查點,當你的任務節點崩潰後重新啓動的話,你可以檢查如果有一個檢查點被保存並從它開始。
與(1)中的相同,但改爲使用數據網格(GridCache API)。
如果您不關心「減少」,請讓您的工作忽略「取消」調用,並讓他們在完成後將結果保存在數據網格中。
- 最佳