Reducer節點需要很長時間才能收到其記錄

當我檢查Hadoop GUI時，發現某些reduce任務已達到66.66％，並且他們在那裏呆了很長時間。當我查看櫃檯時，我發現沒有。的輸入記錄顯示爲零。Reducer節點需要很長時間才能收到其記錄

經過很長時間，他們得到他們的輸入記錄，開始處理它們。一些顯示0輸入記錄甚至更長的時間，並被任務嘗試失敗報告600毫秒的狀態。

但是，一些減速器立即在其計數器中顯示輸入記錄，並立即開始處理它們。

我不知道，爲什麼在獲取某些reducer的輸入記錄方面有這麼多延遲。這隻發生在這個程序中，而不是其他程序。

在這個mapreduce作業中，我在reduce的reduce方法之前的configure方法中，從分佈式緩存中讀取了很多數據。這是原因嗎？我不確定。

來源

2013-03-16 Mahalakshmi Lakshminarayanan

減速機停在哪個階段？您可以發佈有問題的TaskTracker節點的堆棧跟蹤的最後幾行嗎？ – 2013-03-16 17:05:06

嘗試記錄您的配置方法以查看時間。另請注意，只要最後一個映射器完成，一些長時間運行的映射器可能會導致減速器卡住：其洗牌階段將持續。 – 2013-03-16 17:21:24

感謝您的評論。我將記錄配置方法以查看時間。 – 2013-03-17 00:29:45

是的我相信從分佈式緩存中讀取是你拖延的原因。但它不會有所作爲，如果你之前或之後reduce()保持configure()，作爲最終configure()方法必須首先調用，如果你看到減速的run()它看起來像如下（新API）：

public void run(Context context) throws IOException, InterruptedException { 

    setup(context); // This is the counterpart of configure() from older API 

    while (context.nextKey()) { 
     reduce(context.getCurrentKey(), context.getValues(), context); 
    } 
    cleanup(context); 
}

正如你可以看到setup()reduce()叫前，同樣在舊的API這將是除非configure()完成實際reduce任務將無法啓動（這說明你沒有看到記錄計數顯示任何輸入）。

現在作爲百分比：66%，你看，簡化階段實際上下面的子部分：

複製
排序
減少

所以，既然你的第一個完成了兩個步驟，第三個步驟已經開始，但正在等待configure()完成（分佈式緩存被讀取），您的減少百分比爲66％。

來源

2013-03-16 18:58:59 Amar

感謝您的解釋！我也看到有些節點讀完分佈式緩存並很快啓動了reduce方法，但有些節點不。有什麼理由呢？ – 2013-03-17 00:18:37

是否有可能使用reporter.progress（）從context（）方法報告進度？我不知道如何在配置方法中初始化記者。我想知道這是因爲任務失敗，因爲任務未能報告狀態。 – 2013-03-17 00:27:28

您不能在'configure（）'中使用舊的API * mapred *格式的記者，但是您肯定可以使用新的* mapreduce * API從'setup（）'報告進度。你可以使用'context.progress（）;' – Amar 2013-03-18 20:24:39

Reducer節點需要很長時間才能收到其記錄

回答

相關問題