0
我們有一個配置爲高可用性的應用程序。高可用性:名稱節點故障轉移後沒有立即提交作業
其中一個節點被激活(稱爲NN1),另一個節點(稱爲NN2)NameNode進程被終止。所以現在NN1處於活動狀態。
現在我們提交MapReduce工作,以及日誌一直說
「申請的提交沒有完成,提交的申請application_someid仍處於NEW_SAVING」。
發生這種情況約17分鐘,然後成功執行作業。 因此,意味着發生了故障切換並且NN1處於活動狀態。但爲什麼需要這麼長時間?
紗線節點管理器日誌說:
信息org.apache.hadoop.ipc.Client:重試連接到服務器。已經嘗試了9次(s);重試策略是RetryUpToMaximumCountWithFixedSleep(maxRetries = 10,sleepTime = 1000 MILLISECONDS)
有人可以請解釋爲什麼會發生這種情況嗎?
在此先感謝