1
我在Hadoop中有一個複雜的工作流程,使用Sqoop - > Pig + MR - > Hive。如何使用Sql查詢結果觸發hadoop工作流?
一旦某個特定的Oracle表更新了日誌數據,就應該觸發此流程,這與以前的ETL過程的完成有關。
這個主要工作流程包含在Oozie中。我還希望在必要時使用Oozie來觸發流程,因爲Oozie是我組織中最爲成熟的工作流調度程序。
我的理想(假設的)解決方案:
1-那裏每X分鐘和執行SQL語句的Oozie的工作。 根據聲明,作業觸發器(或不)的結果,使用的參數:
2-一個Oozie的作業執行該主工作流
所以,
- Oozie可能嗎?
- 我應該在Oozie中實現嗎?
- 你將如何實現它?
謝謝你,羅恩
PS - 我使用CHD5.2