2014-12-08 62 views
0

大家都知道,名稱節點可以存儲元數據和每秒的一小部分發生在日誌文件中的所有事情。確定錯誤日誌文件只是關鍵因素。現在,默認情況下,輔助Namenode可以定期從Namenode獲取元數據的備份。名稱空間圖像,編輯日誌文件'將在過去的一個小時內進行備份(可配置)。爲什麼Hadoop二級Namenode每隔一小時就需要備份一次?

爲什麼Secondary Namenode需要一個小時,爲什麼它不會每秒都進行一次備份?已經存儲在日誌文件中的第二部分已經存在。爲什麼Hadoop會在每秒鐘的一小部分時間內備份​​日誌文件?如果配置這樣的缺點?請讓我知道深刻。

+1

堂妹SecNameNode提供'checkpoint'設施不'高availability'。考慮每秒/分鐘檢查點的網絡IO。看看http://wiki.apache.org/hadoop/FAQ#What_is_the_purpose_of_the_secondary_name-node.3F – blackSmith 2014-12-08 08:36:36

回答

0
  • 次要的NameNode只有名稱節點的備份
  • 如果NameNode的失敗,整個羣集將出現故障
  • 在那個時候,我們就可以啓動輔助名稱節點作爲NameNode的
  • 我們可以指定次要名稱節點的備份時間
  • 根據交易的數量和秒數,它是可配置。參考Secondary Namenode
1

二級名字節點(SNN)是第一次嘗試減少NN負載,並在一定程度上提供了H.A. 從那時起,像Check Point Node,BackUp Node這樣的SNN已經升級。

SNN:定期複製和合並FSImage和edits.log以獲得更快的NN啓動時間。

檢查點節點:複製併合並FSImage & edits.log。然後它將這個更新的版本發送到NN來替換舊的FSImage。

備份節點:然而,它保留了運行時所有變更的備份,沒有任何延遲。爲了實現這一點,所有的流都與NN和BackUp節點共享,將它們合併並定期發送給NN以更新NN的FSImage文件。因此提供你要求的功能。

至於從NN網絡複製每秒更新的缺點,它將在重載羣集中造成網絡流量的瓶頸。

經過下面的鏈接閱讀更多:https://hadoop.apache.org/docs/current/hadoop-project-dist/hadoop-hdfs/HdfsUserGuide.html#Secondary_NameNode

相關問題