2013-03-30 63 views
1

我需要計算Hadoop集羣中所有節點上運行的每個映射任務的進度。我正在考慮將處理過的數據的大小除以整個輸入數據的大小,但我不確定如何獲取此任務的信息。Hadoop任務進度

我看到TaskStatus類有一個方法getProgress(),但沒有它的描述。它提供了我需要的價值嗎?

回答

2

對於映射任務,是getProgress()返回映射器在輸入文件中的進展程度。爲了減少任務,計算並不簡單。 This article有一個很好的解釋。