2012-10-29 33 views
2

我不明白Ozzie中輸出事件的用途是什麼。 Ozzie文檔聲明「協調員操作可以生成一個或多個數據集實例作爲輸出」,但它沒有給出任何實際的細節或示例。生成一個數據集實例作爲輸出是什麼意思?這是否意味着Ozzie將通過數據集的URI模板創建一個文件夾輸出?我真的不明白爲什麼我應該使用輸出伊芙...Oozie輸出事件

謝謝!

回答

1

如果您在談論Oozie,輸出文件將用於連接不同的協調器作業。考慮一個協調員工作的大DAG,有些工作可能會將其他工作的輸出作爲其輸入。所以數據集是DAG中的邊緣。

例如,在Oozie配置文件中,如果指定協調器A的輸出爲DS1,協調器B的輸出爲DS2,協調器C的輸入爲DS1,DS2,則Oozie會保證您在協調器C中的相應操作在DS1和DS2準備就緒之前不會執行。

+0

感謝您的回答。但是我仍然不明白協調器XML中節點的實際用途是什麼。在你的例子中,你實際上是在描述輸入事件的需要。您的示例中需要輸出事件?因爲即使我不會分別在協調器A和B的中指定DS1和DS2,協調器C仍然依賴於DS1和DS2,因爲它們可能在其輸入事件中聲明。那麼輸出事件節點的實際用途是什麼,而不僅僅是名義上的用途?謝謝 :) – gipouf

1

至少有一個使用您的協調指定<output-event> S的。當重新運行某個日期範圍的協調器時(使用oozie job -rerun命令),指定爲<output-event>的所有相應路徑將被刪除。

有時是除去由協調器的情況下產生的所有輸出是有用的。例如,當您想要啓動另一個具有這些路徑的協調器時,您需要確保它將處理重新運行的數據而不是舊數據。