已經有很多像這樣的問題,有相互矛盾的答案。我還在文學和博客中發現了相互矛盾的言論。在本書中,Hadoop是權威指南,它說當Hadoop MapReduce運行一個組合器時的確切來源
Hadoop不提供保證多少次它會爲特定的映射輸出記錄調用[組合器](如果有的話)。換句話說,調用組合功能爲零,一個或多個時間應產生相同的輸出從減速
的答案在這裏過類似的問題On what basis mapreduce framework decides whether to launch a combiner or not建議,一個組合,如果定義了,總是會被調用一次爲MapOutputBuffer需要刷新。
可能存在邊界情況,其中映射器僅發射一次,這意味着組合器即使已定義也不會運行。
我的問題是:這個問題的答案是否有確切的來源?我當然搜索了Hadoop文檔,但找不到任何東西。
難道你已經擁有了嗎?來自權威指南的摘錄很好地解釋了它。 – franklinsijo
這只是它與我在別處讀過的東西相矛盾(例如,鏈接的答案)是那些說組合器保證錯誤的東西? – Kevin