我是Hadoop,HBase和Hive的新手。我以僞分佈模式安裝Hadoop,HBase和Hive,一切正常。 現在我打算用Hive,HBase和ZooKeeper建立一個簡單的Hadoop集羣(5個節點)。我之前已經閱讀過幾份文件和說明,但我無法找到解決我的問題的好方法。我不確定,在哪裏運行所有的守護進程。這是我的考慮:配置Hadoop,HBase和Hive集羣
Node_1(主)
- 的NameNode
- JobTrakcer
- HBase的主
動物園管理員(獨立節點;通過HBase的管理)
Node_2(Backup_Master)
SecondaryNameNode
Node_3上(SLAVE1)
- DataNode1
- TaskTracker1
RegionServer1
Node_4上(SLAVE2)
- DataNode2
- 的TaskTracker 2
RegionServer2
Node_5上(Slave3)
- DataNode3
- TaskTracker3
- RegionServer3
我知道,在生產中,建議在奇數節點(單獨的集羣)中運行的ZooKeeper合奏。但是對於一個簡單的集羣,可以設置一個在主節點上運行的獨立ZooKeeper節點嗎?
另一個問題是關於Hive:我知道Hive是一個Hadoop客戶端。我是否也應該在主節點上安裝Hive?是否有意義?
感謝您的所有提示和意見! Hakan
注:我只有5臺機器來模擬羣集。
這與您的問題無關,但我想向您指出SecondaryNameNode是* not *備份NameNode。這是一個常見的錯誤,但這不是SecondaryNameNode的目的。如果你想簡單地備份,你應該考慮擁有一個被動/主動NameNode。來源:http://wiki.apache.org/hadoop/FAQ#What_is_the_purpose_of_the_secondary_name-node.3F –
感謝您的提示埃裏克! **沒有人可以幫我解決我的問題嗎?這真的很緊急.. ** – user1818390