我知道map reduce輸出存儲在名爲part-r- *的文件中,用於reducer和part-m- *對於映射器。如何在地圖中創建輸出文件(part-m-0001/part-r-0001)reduce
當我運行MapReduce工作有時得到一個單一的文件全輸出(約150MB大小),有時幾乎相同的數據的大小,我得到兩個輸出文件(一個100MB和50MB等)。這對我來說似乎很隨意。我找不到任何理由。
我想知道它是如何決定把這些數據放在一個或多個輸出文件中。如果有任何方法我們可以控制它。
感謝
非常感謝,這有助於 – sunil