我運行一些批處理作業,其數據輸入不斷變化,我在配置容量時遇到問題。我使用旋轉來完成初始設置,但是一旦啓動,例如5臺機器,我不知道如何在運行時添加新機器。我不知道數據的複雜程度或數據量有多大,所以我想知道是否有一種方法可以將新機器添加到羣集中,並立即生效(或者有一些延遲,但不想必須關閉集羣並將其與新節點一起提交)。如何將新節點添加到活動hbase/hadoop羣集?
2
A
回答
9
在同一時間 - 我不知道已經運行的作業將這些節點的優勢,因爲計劃在何處運行每個任務偏偏作業過程的開始時間(據我所理解)。
我也認爲只在這些瞬態節點上運行任務跟蹤器更實用。
2
檢查由以下參數參照的文件:
- dfs.hosts => dfs.include
- dfs.hosts.exclude
- mapreduce.jobtracker.hosts.filename => mapred.include
- mapreduce.jobtracker.hosts.exclude.filename
可以主機列表添加到文件dfs.include和mapred.include一然後運行
hadoop mradmin -refreshNodes;
hadoop dfsadmin -refreshNodes;
就是這樣。
順便說一句,在0.21
尼基爾
相關問題
- 1. Cassandra 1.0.6將新節點添加到當前單節點羣集
- 2. 如何將新節點添加到cassandra集羣
- 3. 動態添加節點到Phoenix羣集
- 4. 將節點添加到Cassandra羣集
- 5. 向aerospike集羣添加新節點
- 6. 使用Ambari羣集安裝嚮導將新節點添加到羣集
- 7. 將新節點添加到羣集力佈局
- 8. 將新節點添加到Google雲上的現有datastax羣集
- 9. 如何將節點添加到mnesia集羣?
- 10. 如何從多節點cassandra集羣重新啓動一個活動節點?
- 11. 如何在添加新節點後重新平衡cassandra集羣
- 12. 在Kubernetes集羣中添加節點後重新分發集羣
- 13. 如何將新節點類型添加到已部署的服務Fabric羣集?
- 14. 無法添加新節點到現有的加萊拉羣集
- 15. 如何在運行Solr集羣中添加新節點與tomcat
- 16. 如何將新節點添加到dijit.Tree
- 17. 如何將新節點添加到XML
- 18. 彈性搜索:動態添加節點到集羣
- 19. 使用Windows中的cmd將節點添加到羣集elasticsearch
- 20. 將節點添加到服務Fabric羣集
- 21. 無法將節點添加到現有Cassandra羣集
- 22. Cassandra DataStax Community Edition將節點添加到羣集
- 23. Ambari - 將節點添加到羣集時執行腳本
- 24. 無法將計算節點添加到HPC羣集
- 25. 將Cassandra 2.1節點添加到Cassandra 1.2.15羣集?
- 26. Postgres XL將數據節點添加到現有集羣
- 27. 將數據節點添加到hadoop集羣
- 28. MSDTC - 將第三個節點添加到Windows羣集中
- 29. Elasticsearch 2.2集羣:添加節點失敗
- 30. 在線添加MySQL羣集Sql節點
未開始的任務加入「mradmin -refreshNodes」設施可以在新的節點安排,但不會打破現有任務。此外,由於沒有任何新節點將在本地存儲數據,因此將數據推送到這些節點進行處理的開銷可能大於處理它的處理成本。 – 2012-04-23 18:42:15