HDFS fsimage和editlog寫入多個位置,包括NFS掛載。
A)的NameNode守護程序崩潰: 解決方案: 剛剛重新啓動的Namenode過程
B)主機關閉命名節點運行的位置。
解決方案:
- 與空dfs.name.dir
- 點dfs.name.dir到NFS掛載,我們有元數據的副本開始在不同的主機名稱節點。 或
- 使用--importCheckpoint選項同時指出fs.checkpoint.dir後開始的NameNode從二級NameNode的
- 更改fs.default.name到備份主機名URI檢查點目錄並重新啓動集羣與所有的奴隸IP在從屬文件中。
注 - 我們可能會錯過上次檢查點後可能發生的編輯。
方案2:
的HDFS的FsImage被寫入一個目錄中。
A)的NameNode守護程序崩潰: 解決方案:未知
B)主機已關閉命名節點運行的位置。
解決方案:
- 創建指向dfs.name.dir在目錄中的一個空白目錄(1)
- 啓動的Namenode與-importCheckpoint指向fs.checkpoint.dir從二級目錄設置檢查點後NameNode的
- 更改fs.default.name到備份主機名URI並重新啓動集羣的所有從IP的奴隸文件。
這種方式,我們會再次錯過最後一個檢查點之後編輯的文件。
請讓我知道,如果這是我們如何能夠手動恢復集羣。
你可以編輯你的文章,包括一個正確的問題嗎?我不確定你在問什麼。如果您有它們,發佈一些日誌文件片段也會很有幫助。它會幫助我診斷你的問題。謝謝 – 2012-03-15 02:00:53
我正在給一些生產場景。在情景1和情景2的情況下要做什麼。爲了獲得不同的名稱節點恢復技術 – Jagaran 2012-03-15 03:30:47
現在改變了問題 – Jagaran 2012-03-15 03:51:45