我正在使用oozie執行HDFS數據傳輸操作,要求在aws S3存儲桶中存在可用數據時觸發oozie工作流作業。我正在考慮在S3存儲桶中保存成功文件以及數據文件,但我不確定如何使oozie協調器定期從S3讀取以檢查成功文件是否可用。 如果有人可以提供相同的樣本coordinator.xml,那將會很棒。如何在aws中存在成功文件時觸發oozie作業
1
A
回答
0
你可以試試下面的: -
<coordinator-app name="FILE_CHECK" frequency="1440" start="2017-04-17T00:00Z" end="2018-04-17T00:00Z" timezone="UTC" xmlns="uri:oozie:coordinator:0.1">
<datasets>
<dataset name="datafile" frequency="60" initial-instance="2017-04-16T00:00Z" timezone="UTC">
<uri-template>s3n://mybucket/a/b/${YEAR}/${MONTH}/${DAY}</uri-template>
<done-flag><flag to check></done-flag>
</dataset>
</datasets>
<input-events>
<data-in name="coorddatafile" dataset="datafile">
<instance>${coord:current(0)}</start-instance>
</data-in>
</input-events>
<action>
<workflow>
<app-path><workflow_path></app-path>
<configuration>
<property>
<name>fileDirectory</name>
<value>${coord:dataIn('coorddatafile')}</value>
</property>
</configuration>
</workflow>
</action>
</coordinator-app>
相關問題
- 1. 在Oozie中將作業安排爲文件觸發器
- 2. 如何在特定情況下觸發Oozie作業?
- 3. 如何在Oozie工作流程EL功能中使用Oozie作業屬性?
- 4. 如何在SCM中更改作業B時觸發作業A
- 5. 如何在成功時保留PIG作業日誌文件。
- 6. 如何在以前的工作流程完成時觸發Oozie工作流程
- 7. 如何在另一個完成時觸發作業?
- 8. 在hdfs(hadoop)目錄中移動文件時觸發作業
- 9. 如何使用oozie觸發sqoop動作
- 10. Dataflow作業「成功」後,臨時文件保留在GCS中
- 11. 如何在服務器文件夾中進行更改時觸發Jenkins作業?
- 12. 如何在Maven Build成功後觸發批處理文件?
- 13. 如何在手動觸發作業時在jenkin作業電子郵件循環中添加特定收件人?
- 14. Oozie的協調觸發時在HDFS路徑中的任何文件
- 15. 使用jar文件在oozie中運行hadoop作業
- 16. 在oozie作業中出現錯誤
- 17. 在cloudera中爲oozie作業配置JAVA_HOME?
- 18. 如何在Oozie工作流程中使文件成爲可選文件?
- 19. 在完成SSIS作業時觸發SSRS報告
- 20. 如何在作業失敗時觸發laravel作業失敗()方法?
- 21. 如何重新加載oozie作業配置文件而不重新啓動oozie作業
- 22. 如何在AWS中爲hadoop Mapreduce作業創建作業jar
- 23. Oozie作業失敗
- 24. 如何安排OOZIE作業,如果在給定文件夾中發生任何更改?
- 25. 如何在Hangfire作業成功或失敗時執行新作業?
- 26. 如何在運行期間在Jenkins中觸發作業?
- 27. 如何在Illustrator中保存文件時自動觸發導出操作?
- 28. 如何在成功完成另一個作業後觸發jenkins作業,並且這兩個作業都在不同的Jenkins服務器上運行
- 29. 如何在iframe在jQuery中完成加載時觸發事件?
- 30. 在Quatz作業中觸發的JobDataMap xml
可以調用Oozie的REST API啓動作業,從AWS LAMBDA觸發器,它會被調用在s3上傳事件 – Ashan
如何爲當前在基於時間的協調器上運行的作業創建oozie REST api? – greperror