2015-06-19 28 views
1

當看到有關MapReduce的,我讀了以下有趣的臺詞:什麼時候在mapreduce作業執行中分配reducer的數量/節點?

但如何做減速的知道哪個節點來查詢,以獲得他們的 分區出現這種情況通過應用程序主由於每個 映射器實例?完成後,它會通知有關 它在其運行過程中產生的分區的應用程序主機。每個減速 直到 收到的節點託管其分區的最終名單將定期查詢爲映射主機應用程序主機。

我在這裏有一個疑問。當他們說每個減速器究竟是什麼意思?減速器是否會在地圖階段開始之前分配,以及減速器節點如何選擇?

回答

0

減速器可以在地圖完成數據處理之前啓動。一旦他們啓動,他們就可以從映射器中提取數據,但只有在所有映射器完成數據處理之後纔會開始處理。

mapred.reduce.slowstart.completed.maps是配置此行爲的屬性。有關酒店here的更多信息。

+0

感謝細節Praveen .. !! Reducer節點是否會根據其中的任務跟蹤器的可用性來選擇?節點是否有可能運行地圖以及單個作業的減少任務? – Sathyaraj

+0

映射器基於數據局部性運行,對減速器的運行位置沒有限制。減速器根據插槽的可用性運行。映射器和reducer可能/可能不運行同一臺機器。我們沒有任何控制權。 –

+0

謝謝大師ji :) – Sathyaraj

相關問題