現在我想以一個新的Datanode添加到我的Hadoop集羣 我需要停止或關閉Hadoop集羣,並添加新的數據節點 我如何到Hadoop集羣中添加一個新的數據節點的Hadoop集羣配置
1
A
回答
1
基本上,您停止羣集,將節點的IP地址添加到conf/slaves
,然後再次重新啓動羣集。 PS:Iff啓動和停止很煩人(並且可能需要幾個小時才能處理大型文件羣),您可以在其中添加一些仿真IP,並且當有更多的從屬羣加入羣集時,您只需啓動它們即可。 Hadoop不關心有多少奴隸配置或關閉:它將使用它可以獲得的。而定義尚未存在的奴隸是在Hadoop中熱插入奴隸的好習慣。
1
在這種情況下,您不需要關閉或重新啓動整個羣集。
首先,將新節點的主機名添加到主節點上的conf/slaves文件中。 還要在所有機器上的etc/hosts文件中添加ipaddress和主機名,以便它們進行通信。然後登錄到新的從節點並執行以下命令:
$ cd path/to/hadoop
$ bin/hadoop-daemon.sh start datanode
$ bin/hadoop-daemon.sh start tasktracker
1
您不需要重新啓動hadoop羣集。根據此document,您可以在包含文件中添加節點,並在hdfs-site.xml和mapred-site.xml文件中進行一些更改,您可以實現此目的。詳細說明在this document
相關問題
- 1. 的Hadoop集羣配置/安裝
- 2. 的Hadoop + ambari集羣變更配置
- 3. 設置hadoop集羣
- 4. 配置Hadoop,HBase和Hive集羣
- 5. 將Hadoop配置爲多節點羣集
- 6. 配置多模式Hadoop集羣
- 7. Hadoop多主集羣設置
- 8. 設置(Windows)Hadoop集羣
- 9. 爲Hadoop集羣
- 10. Hadoop集羣與碼頭羣
- 11. Hadoop的多節點集羣設置
- 12. 如何配置的主人/奴隸機Hadoop的1.2.1集羣
- 13. Jackrabbit羣集配置
- 14. Coherence集羣配置
- 15. Nifi集羣配置
- 16. Bigcouch羣集配置
- 17. Tomcat集羣配置
- 18. 配置單元表導出到羣集+ distcp內的其他hadoop羣集或配置單元導出?
- 19. Hadoop集羣工作
- 20. Hbase Hadoop集羣.. java.io.IOException:java.lang.NoSuchMethodExceptio
- 21. 在hadoop集羣上安裝spark集羣
- 22. Ambari Hadoop集羣+最好的方式來修改配置
- 23. hadoop集羣配置 - dfsnodelist上的節點顯示爲localhost
- 24. 配置單元分佈式查詢加入數據從on-primise hadoop羣集和亞馬遜s3 hadoop羣集
- 25. Hadoop單節點集羣設置問題
- 26. 自動設置多節點Hadoop集羣
- 27. 如何設置hadoop集羣優先級?
- 28. 設置3節點hadoop羣集
- 29. NFS上的Hadoop集羣
- 30. Hadoop集羣的類型
因此,在添加新數據節點之前停止我的集羣是強制性的嗎? –
在這種情況下:是的。因爲每個其他TT和DN必須知道整個羣集(並且從站配置僅在啓動時填充)。 –
因爲這有點奇怪,你可以爲未來的節點添加'保留'(未加入)的IP。這樣,只有在保留的IP用完時才需要關閉羣集:-)這也困擾了我。而像Facebook這樣的公司不會重新啓動Hadoop集羣來添加節點。我認爲這是大規模集羣的配置方式。 –