閱讀關於MapReduce的論文,並提到將所有中間鍵分組在一起。在MapReduce中,如何在多臺機器上執行相同的reduce任務?
當減少工作人員已讀取所有 中間數據時,它使所有的 出現相同的密鑰的被組合在一起通過中間鍵進行排序。排序是 需要,因爲通常很多不同的鍵映射到相同的減少 任務。如果中間數據量太大,無法在 存儲器,外部排序是使用
有沒有相同的reduce任務提到在多臺機器被exectued。
當reduce任務完成時,reduce worker會自動將其臨時輸出文件重命名爲最終輸出文件。如果在多臺機器上執行相同的減少 任務,則會爲相同的最終輸出文件執行多個重命名調用 。
如果將相同的鍵組合在一起,是不是會成爲一個減少工作人員運行的減少任務?同一個reduce任務如何在多臺機器上運行?
Same Reduce任務可以在多臺機器上運行。 –