2012-01-04 137 views

回答

0

Hadoop將gz文件傳輸到映射程序正在執行的節點;解壓縮文件然後迭代內容。每個文件將由一個映射器進行操作。

如果文件損壞,映射器可能永遠不會真正執行映射器(或者只是映射函數,如果我們假設映射器獲取已啓動; Hadoop嘗試解壓文件;靜默失敗並繼續到映射器爲輸入一個空文件。在「解壓縮文件」的內容是空的,這使得映射器成功完成。

您可能需要在setupcleanup功能,從而讓你檢測「空一些代碼'文件,所以你可以增加一個計數器,說這個工作並沒有實際處理任何數據。

相關問題