1)在使用Hadoop V2時,我們是否在生產環境中使用Secondary NameNode?
它完全取決於您的生產環境設置。如果您將Hadoop V2與HA一起使用,則您不需要生產中的Secondary NameNode,因爲您的Slave NameNode將以最佳方式執行與Secondary NameNode相同的任務。但是如果您的生產設置不利用NameNode HA,則必須使用Secondary NameNode進行點校驗。請參閱Understanding Hadoop 2.x Architecture和它的惡魔的更多信息。
2)對於Hadoop的V2,假設我們使用了高可用性和當編輯日誌文件主動/被動連接muliple NameNodes越來越龐大,
按我這裏是瞭解你的主要關注「Hadoop V2中的NameNode HA如何管理編輯日誌?」
下面是答案:編輯日誌管理可以通過仲裁日誌管理器(QJM)或NFS共享存儲
隨着QJM來完成,有魔叫JournalNode(JN)的組活躍的NameNode進行通信。該組不斷尋找由活動的NameNode完成的任何更新並保持該狀態。 StandBy NameNode不斷從JN獲取編輯日誌更新並維護更新後的editlog文件。
使用NFS共享存儲,Active NameNode和StandBy NameNode都可以訪問共享存儲(即網絡文件系統)上的特定目錄。在由NameNode完成任何更新的情況下,它將事件記錄到共享目錄。另一方面StandBy NameNode正在尋找在同一共享目錄上的更新,並同時更新編輯日誌。
我希望這有助於...
非常感謝您的詳細解釋。 – avinash