2016-01-25 32 views
0

Checkpoint節點週期性地從NameNode中獲取fsimage和編輯併合並它們。結果狀態稱爲檢查點。這之後將結果上傳到NameNode。Secondary NameNode和Checkpoint節點之間的區別

是否在Hadoop 2.x版本中使用檢查點名稱節點?如果是,是否還需要二級名稱節點?

此外,當Hadoop版本2中有多個Name節點時,檢查點名稱節點如何工作?

任何人都可以澄清這些混亂的概念嗎?

回答

1

看一看這個SE問題更多細節上的每個節點的責任:

Hadoop 2.0 Name Node, Secondary Node and Checkpoint node for High Availability

您不必配置第二名稱節點和節點檢查站Hadoop中的2.0

相反,您需要主動名稱節點和備用名稱節點以獲得高可用性,如文檔page

在典型的HA羣集中,兩臺獨立的機器配置爲NameNode。 在任何時間點,NameNodes中只有一個處於Active狀態,另一個處於Standby狀態

活動NameNode負責羣集中的所有客戶端操作,而備用服務器僅充當從服務器,如果需要維護足夠的狀態以提供快速故障轉移

爲了使備用節點,以保持其與所述主動節點同步狀態,兩個節點與一組獨立的守護程序的所謂的「JournalNodes」(JNS)進行通信。

當活動節點執行任何名稱空間修改時,它會將修改記錄持久記錄到大多數這些JN中。備用節點能夠讀取來自JN的編輯,並不斷監視它們以更改編輯日誌。

隨着備用節點看到編輯,它將它們應用到它自己的名稱空間。在發生故障轉移時,備用服務器將確保它已將JounalNodes中的所有編輯提升至活動狀態之前。這確保了在故障轉移發生之前命名空間狀態已完全同步。

爲了提供快速故障轉移,備用節點還需要具有關於羣集中塊的位置的最新信息。爲了實現這一點,DataNode配置了兩個NameNode的位置,並將塊位置信息和心跳發送到兩者。

請參閱相關的SE問題,瞭解更多詳情:

How does Hadoop Namenode failover process works?

相關問題