默認塊大小Hadoop 2.x爲128MB。 64MB有什麼問題?Hadoop 2.x中的默認塊大小
2
A
回答
1
HDFS的塊大小非常巨大以儘量減少查找時間。最佳塊大小取決於平均文件大小,查找時間和傳輸速率。
磁盤越快,數據塊越大,但有一個限制。
要利用數據局部性分割具有相同大小的數據塊,因爲我們爲每個分割開始一個線程,太大的塊會減少並行性。 所以最好的是:
- 保持尋道時間低。 ( - >在快速磁盤上增加塊大小)
- 保持分割不能太低。 ( - >減少塊大小)
- 利用數據局部性。 ( - >保持分割大小與塊大小接近)
128MB是當今磁盤速度和大小以及計算性能的不錯選擇。
2
增加塊大小有一些原因。如果您正在管理大型Hadoop數據集的peta字節,它可以提高性能。
如果你正在管理的1地圖字節集羣,64 MB塊大小的結果爲15+百萬塊,其是很難的Namenode有效地管理。
在執行MapReduce的過程中,擁有大量的塊也會導致大量的映射器。
根據您的數據要求,你可以微調dfs.blocksize
通過正確設置你的塊大小(64MB或128 MB或256 MB或512 MB),你可以acheive
- Namenode性能的提高
- 由於映射器的數量直接取決於塊大小,所以Map reduce作業的性能有所提高。
有關更多詳細信息,請參閱此link。
+0
謝謝你的回答。 如果是這種情況,那麼爲什麼Hadoop 1.x中的默認塊大小不是128MB? –
相關問題
- 1. 默認大小
- 2. 默認大小
- 3. Hadoop中輸入拆分的默認大小
- 4. hadoop map漏油大小和塊大小
- 5. Hadoop塊大小問題
- 6. Hadoop fs查找塊大小?
- 7. SystemIcons默認大小
- 8. 將Hadoop塊大小更改爲低於最小塊大小
- 9. Blocking collection的默認大小
- 10. 我可以修改git-add的默認**大塊大小嗎?
- 11. 默認/找到hadoop 1.x中的mapper和reducer的數量
- 12. 將ggplot中的圖例大小減小到默認大小
- 13. Foundation中的默認字體大小?
- 14. MULE中的默認線程池大小
- 15. Excel 2010中的默認圖表大小
- 16. Nutch在Hadoop 2.x
- 17. TinyMCE默認字體大小
- 18. ERLANG - 默認浮點大小
- 19. WPF控件默認大小
- 20. 增加默認大小
- 21. Google圖表默認大小
- 22. Vimeo默認視頻大小
- 23. 默認UITableViewCellStyleSubtitle字體大小?
- 24. iterm2默認窗口大小
- 25. 如何在OpenCV中更改默認棋盤格塊大小
- 26. Hadoop每個文件塊大小
- 27. iOS滑塊的默認縮略圖大小?
- 28. 在Windows中設置默認堆大小
- 29. 在Linux中啓動默認堆大小?
- 30. 如何在opencart 2.x的默認滑塊中添加一些文本?
我想,應該有適當的理由。 我在Deloitte採訪中遇到過這個問題。 –
https://community.hortonworks.com/questions/16278/best-practises-beetwen-size-block-size-file-and-re.html – ozw1z5rd