2015-11-03 18 views
0

我們有一個配置爲高可用性的應用程序。高可用性:名稱節點故障轉移後沒有立即提交作業

其中一個節點被激活(稱爲NN1),另一個節點(稱爲NN2)NameNode進程被終止。所以現在NN1處於活動狀態。

現在我們提交MapReduce工作,以及日誌一直說

「申請的提交沒有完成,提交的申請application_someid仍處於NEW_SAVING」

發生這種情況約17分鐘,然後成功執行作業。 因此,意味着發生了故障切換並且NN1處於活動狀態。但爲什麼需要這麼長時間?

紗線節點管理器日誌說:

信息org.apache.hadoop.ipc.Client:重試連接到服務器。已經嘗試了9次(s);重試策略是RetryUpToMaximumCountWithFixedSleep(maxRetries = 10,sleepTime = 1000 MILLISECONDS)

有人可以請解釋爲什麼會發生這種情況嗎?

在此先感謝

回答

0

我不知道這個問題, 的原因,但重新啓動紗服務幫助我解決這個問題。

相關問題