getSplits()方法返回的是什麼? 根據Apache文檔它返回InputSplit的數組,這是什麼意思?getSplits()方法返回的是什麼?
它是否返回映射器要運行的文件字節塊?
假設我們有各50MB的3個文件,則它返回[0]時,64MB(36MB第二+第三的28MB),36MB(第三文件)64MB的字節(50MB + 14MB第二文件)並且每個都由3個不同的映射器處理?
如果我們有一個120MB的大文件,那麼它會返回相同文件的64MB塊?
我甚至不確定我所要求的邏輯與否,我是Hadoop棧新手。
謝謝@Andrey Sozykin – 2015-03-09 08:53:29