2017-04-03 38 views

回答

0

它可以設置分割大小超過塊大小。但是在這種情況下,得到一個分割映射器應該從hdfs中讀取幾個塊,這可能導致網絡傳輸,因爲塊n和塊n + 1可能不在一個datanode中。

在你的例子中,如果你設置splitsize = 130mb,並且你的輸入數據是一個130mb文件,那麼你將有1個映射器。

+0

因此,在這種情況下,一個映射器只會讀取第一個128 MB數據,然後再讀取剩餘的2 MB數據。否則它會一次讀取整個130MB的數據? –

+0

你的'一次'是什麼意思? – fi11er

+0

我的意思是在同一時間。 –

相關問題