我有一臺Apache Hadoop 1.1.1的單節點實例,它具有大量內存和非常有限的可用磁盤空間大小的計算機上的默認參數值(請參閱例如[1]和 [2]) 。然後,我注意到這個Hadoop實例在映射任務期間浪費了大量磁盤空間。爲了利用高容量RAM和減少磁盤空間使用量,我應該注意哪些配置參數?高內存計算機上的Hadoop單節點配置
1
A
回答
2
您可以使用幾個mapred。*參數壓縮映射輸出,這將大大減少存儲映射器輸出所需的磁盤空間量。請參閱this question瞭解一些好的指針。
請注意,不同的壓縮編解碼器會有不同的問題(即GZip需要比LZO更多的CPU,但您必須自己安裝LZO)。 This page對Hadoop中的壓縮問題進行了很好的討論,儘管它有點過時。
的RAM,你需要的金額取決於你在你的地圖,減少工作在做什麼,雖然可以增加你堆大小:
conf/mapred-site.xml mapred.map.child.java.opts
更多這方面的詳細信息,請參見cluster setup。
0
您可以在hdfs-site.xml中使用dfs.datanode.du.reserved
來指定您不會使用的磁盤空間量。我不知道hadoop是否能夠補償更高的內存使用量。
但是,如果您運行磁盤I/O密集型的mapreduce作業,則會出現問題。我認爲任何數量的配置都不會對你有所幫助。
相關問題
- 1. 單節點配置運行Hadoop
- 2. hadoop單節點設置
- 3. 在計算機上的Ram配置
- 4. Hadoop節點高可用性
- 5. 什麼消耗Hadoop YARN中的計算機內存?
- 6. unbuntu下的單節點Hadoop設置12.0.04
- 7. 單節點的Hadoop設置unbuntu 10.04
- 8. 將Hadoop配置爲多節點羣集
- 9. Hadoop客戶端節點配置
- 10. hadoop 2.7.1 - 配置輔助名稱節點
- 11. F#計算三元節點的高度
- 12. Hadoop Datanode配置內核和內存
- 13. 節點主機配置
- 14. Hadoop機器配置
- 15. 客戶機上的hadoop api配置
- 16. hadoop集羣配置 - dfsnodelist上的節點顯示爲localhost
- 17. 更改Hadoop從節點上的默認配置?
- 18. Hadoop單節點集羣設置問題
- 19. 的Hadoop 2.6.1單節點設置:數據節點未啓動
- 20. 掃描計算機內存
- 21. 枚舉計算機內存
- 22. Hadoop&Hbase安裝和配置窗口上單個節點集羣中的問題
- 23. Hadoop名稱節點HA配置單元故障
- 24. 我可以在配置多節點後使用單節點配置嗎我說的是hadoop
- 25. 使用Hadoop的高性能計算機的成本效益
- 26. Openshift節點存儲配置
- 27. mongodb單節點配置
- 28. 在Hadoop 1.2.0中配置作業內存
- 29. 內存位置計算
- 30. hadoop單節點設置bash:bin/hadoop權限被拒絕