0
Reduce方法處理來自地圖的分組數據。但我不知道如何減少任務採取組數據?如果地圖輸出很多分組數據,那麼每個減少任務只讀取相同數量的組?什麼是機制?hadoop如何減少任務處理地圖分組數據
Reduce方法處理來自地圖的分組數據。但我不知道如何減少任務採取組數據?如果地圖輸出很多分組數據,那麼每個減少任務只讀取相同數量的組?什麼是機制?hadoop如何減少任務處理地圖分組數據
如何減少任務佔用組數據?
據上隨機處理,並且排序相
在此phasedData其由映射器發送由密鑰(像組由(密鑰)),最後它獲得密鑰,列表<>結果進行分組。結果發送給reducer。如果結果需要發送到不同的減速器,則需要考慮與洗牌和排序階段不同的階段。
這個階段是由Hadoop框架完成的,據我所知你沒有任何事情要做或改變這個階段。
也是我建議看看這個問題What is the purpose of shuffling and sorting phase in the reducer in Map Reduce Programming?