2011-03-10 37 views
1

我正在處理批處理問題。解決方案需要處理失敗的硬件。Gridgain故障轉移的主(發件人)節點

有主節點(它啓動任務執行)和執行作業的工作節點。我知道工作節點的故障轉移如何工作,但我找不到有關主節點故障轉移的任何信息。只要主節點啓動任務失敗,整個任務就會被取消。

有什麼辦法可以完成任務處理呢?

你能否提出實現主節點故障切換的最佳方式?

親切的問候, 庫巴

回答

2

每當你的主節點死了,基本上就沒有人來執行的MapReduce任務的的「減少」的一步。

有幾種方法可以嘗試減輕這個問題:

  1. 保存使用GridCheckpointSpi(GridTaskSession.saveCheckpoint(..)API)中間檢查點,當你的任務節點崩潰後重新啓動的話,你可以檢查如果有一個檢查點被保存並從它開始。

  2. 與(1)中的相同,但改爲使用數據網格(GridCache API)。

  3. 如果您不關心「減少」,請讓您的工作忽略「取消」調用,並讓他們在完成後將結果保存在數據網格中。

- 最佳