我有一個hadoop map-reduce作業作爲Oozie工作流程的一個步驟運行。 它使用實現org.apache.hadoop.util.Tool的java動作啓動。如何在Oozie中找到更多具體的錯誤信息
由於某種原因,當作業被殺害時,如果在處理過程中出現異常,我希望能夠通過電子郵件發送包含堆棧跟蹤的通知。
目前我做這種方式:
<action name="sendErrorNotifications">
<email xmlns="uri:oozie:email-action:0.1">
<to>[email protected]</to>
<subject>Job execution failed ${wf:id()}</subject>
<body>Job execution failed, error message: [${wf:errorMessage(wf:lastErrorNode())}]</body>
</email>
<ok to="fail" />
<error to="fail" />
</action>
但所有我得到的只是:
Job execution failed, error message: [Job failed!]
這是不是很實用:),我需要去檢查所有的節點記錄我自己。
如何獲得更具體的消息?我應該抓住我的異常,幷包裝成在工具的一些Oozie的-開捕一個,或者只是使用的東西,而不是$ {WF:...的errorMessage
感謝
問題是,它不可能在工具中捕獲reducer中發生的異常。我們在那裏有一份工作狀態,所以我們現在可以出現問題了......我將提供我用作解決方案的解決方案。 – Art