0
A
回答
1
每個輸入分割大小通常等於HDFS塊大小。例如,對於1GB大小的文件,如果塊大小爲64MB,則會有16個輸入拆分。但是,拆分大小可以配置爲小於/大於HDFS塊大小。對於一般情況,使用FileInputFormat完成輸入分割的計算。輸入分配的大小
計算在InputFileFormat做的:
Math.max("mapred.min.split.size", Math.min("mapred.max.split.size", blockSize));
一些例子:
mapred.min.split.size mapred.max.split.size dfs.block.size Split Size
1 (default) Long.MAX_VALUE(default) 64MB(Default) 64MB
1 (default) Long.MAX_VALUE(default) 128MB 128MB
128MB Long.MAX_VALUE(default) 64MB 128MB
1 (default) 32MB 64MB 32MB
對於詳細的解釋,您可以查看here。
相關問題
- 1. 輸入分配Hadoop中
- 2. Hadoop輸入拆分轉儲
- 3. 創建輸入分割(HADOOP)
- 4. 實現輸入拆分(HADOOP)
- 5. Hadoop中的輸入分割定製
- 6. 拆分輸入到子豬(Hadoop的)
- 7. Hadoop堆分配
- 8. 爲Hadoop/PIG輸出數據分配ID
- 9. Hadoop多輸入
- 10. Hadoop如何執行輸入拆分?
- 11. Hadoop讀取輸入分裂多次
- 12. Hadoop任務分配
- 13. Hadoop輸入文件
- 14. Hadoop MapReduce多輸入
- 15. Hadoop的分配差異
- 16. 將數據拆分爲Hadoop中的輸出和新輸入
- 17. hadoop - Hadoop jar輸入路徑問題
- 18. hadoop上的分佈式數據分配
- 19. 輸入輸出參數錯誤的Hadoop
- 20. 分配輸入,就其len()
- 21. Hadoop Map/Reduce工作分配
- 22. Hadoop Streaming多行輸入
- 23. Hadoop輸入格式 - 用法
- 24. Hadoop輸入文件訂單
- 25. 重新分配輸入/輸出流?
- 26. Hadoop多個輸入錯誤分組 - 雙向加入練習
- 27. 設置輸入分割不工作的映射器的Hadoop數
- 28. Hadoop的輸入分離 - 它是如何工作的
- 29. Hadoop,MapReduce - 多輸入/輸出路徑
- 30. Hadoop中輸入拆分的默認大小
請爲此使用Google。 SO不是這樣的問題的地方。 – Tariq