1
有沒有辦法跳過一個失敗的地圖作業而不是殺死整個作業?我有成千上萬的地圖工作都運行良好,總是有這個令人討厭的最後地圖工作,永遠需要並最終殺死大工作。跳過失敗的地圖作業
有沒有一種方法來設置要麼喜歡「忽略失敗」的一般設置或可忽略不計的地圖的百分比?
我不是在尋找與數據的100%完美的效果,一個好的估計有95%的人完全足夠了。
有沒有辦法跳過一個失敗的地圖作業而不是殺死整個作業?我有成千上萬的地圖工作都運行良好,總是有這個令人討厭的最後地圖工作,永遠需要並最終殺死大工作。跳過失敗的地圖作業
有沒有一種方法來設置要麼喜歡「忽略失敗」的一般設置或可忽略不計的地圖的百分比?
我不是在尋找與數據的100%完美的效果,一個好的估計有95%的人完全足夠了。
您可以使用(在新版本2.1.0 mapreduce.map.failures.maxpercent)和mapred.max.reduce.failures.percent屬性mapred.max.map.failures.percent來支配自己的工作失誤
http://hadoop.apache.org/docs/current/hadoop-project-dist/hadoop-common/DeprecatedProperties.html