2014-02-27 60 views
0

我正在使用新的Hadoop API,因爲沒有辦法明確指定映射器的數量(與舊API不同),所以我需要更改數據塊的大小,以便可以控制映射器的數量。如何更改代碼中數據拆分的默認大小?如何更改Hadoop中數據塊的大小?

+1

http://stackoverflow.com/questions/2669800/changing-the-block-size-of-a-dfs-file-in-hadoop可能有幫助 – michaeltang

+0

我不認爲你可以在舊的API,無論是。 – vefthym

回答

0

映射器的數量由(文件)分割確定
分割大小由正在使用的InputFormat確定。
mapred.max.split.size參數將允許您定義拆分大小。