2
A
回答
1
我認爲實現此目的的一種方法可能是監視Shuffle和Sort階段所花費的任務和時間所花費的總時間。您可以使用TaskStatus類提供的以下方法來查找:
getStartTime():獲取任務的開始時間。
getFinishTime():獲取任務完成時間。如果之前沒有設置shuffleFinishTime和sortFinishTime,則將它們設置爲finishTime。在心跳間隔中完成洗牌,分類和完成時的情況並不單獨報告。如果任務狀態爲TaskStatus.FAILED,則表示任務失敗時的結束時間。
:獲取任務的洗牌完成時間。如果由於在同一心跳間隔內結束的隨機/排序/結束階段而未設置隨機播放結束時間,則會設置下一個階段的結束時間,即排序或任務完成時間。
getSortFinishTime():獲取任務的排序完成時間。如果排序完成時間由於排序而沒有設置,並且在相同的心跳間隔內減少相位整理,則設置完成時間時設置爲結束時間。
另一種方法可以是使用Counters
。
請讓我知道這是否回答您的查詢。謝謝。
相關問題
- 1. Hadoop Map Reduce CustomRecordReader減少階段
- 2. WEKA類映射和減少KMeans階段在hadoop上聚類
- 3. Hadoop減少錯誤
- 4. Distibuted Cache減少Hadoop
- 5. 遠程執行Hadoop作業時在減少階段出現異常
- 6. Hadoop的 - 地圖-減少 - java.lang.NoClassDefFoundError
- 7. 在solr中減少詞頻的權重?
- 8. 僅僅是減速階段的工作?
- 9. hadoop減少拆分大小
- 10. Hadoop地圖減少:算法
- 11. 地圖減少沒有hadoop
- 12. hadoop - 地圖/減少功能
- 13. Hadoop地圖/減少鏈接
- 14. 迭代映射減少作業。如何減少輸出量並將其輸送到下一個階段?
- 15. 長Hadoop的運行,停留在減少>減少
- 16. 映射/減少計數的兩階段排序
- 17. cygwin的hadoop的地圖,減少問題
- 18. 乾淨地分離的Hadoop階段
- 19. 使用Hadoop和HBase減少一個映射然後減少
- 20. Hadoop YARN作業在地圖0%處減少並減少0%
- 21. Hadoop - 減少溢出記錄的數量
- 22. Hadoop減少內存中的shuffle合併
- 23. 減少的Hadoop功能不起作用
- 24. 讀取Hadoop的地圖矩陣減少
- 25. 的Hadoop - 故障中恢復僅減少
- 26. hadoop map減少程序中的InstantiationException
- 27. Hadoop的:通過測量每個階段的持續時間(地圖,隨機播放/排序,減少)
- 28. 當有更少的減少任務時,Hadoop減少會變得更慢
- 29. 如何測量Hadoop中每個階段(地圖,混洗/排序,減少)的持續時間?
- 30. 與高階回調參數減少
是的,這正是我所需要的。謝謝! – MihaelaO
很高興能有所幫助。不用謝。 – Tariq
Map階段有不同的處理階段嗎?更明確的是,Hadoop是否區分執行map函數的階段和重新排序結果的階段?如果是這樣,是否有辦法獲得這些地圖階段的權重? – MihaelaO