每個轉換都會在一個文件夾中創建一個csv文件,並且我想在轉換完成時上傳所有這些文件。我添加了一個Dummy
,但這個過程並沒有按照我的預期工作。每個轉換將執行Hadoop Copy Files
步驟。爲什麼?我怎麼能設計流程?謝謝。所有的虛擬步驟在作業中不起作用
1
A
回答
2
首先,如果可能的話,儘量發動平行的.ktr文件(右鍵單擊開始步驟>並行點擊啓動下一個條目)。這將確保所有的ktr並行運行。
其次,您可以選擇的,這取決於你的可行性下面的步驟(而不是虛擬步):
- 「檢查是否存在的文件」步驟:移動到Hadoop的步驟之前,你可以做一個小的檢查,如果所有的文件已經正確創建,然後繼續執行。
- 「等待」步驟:在轉到下一個條目之前,您可以花一些時間等待完成所有步驟。我不建議這樣做,因爲編寫csv文件的時間可能會有所不同,除非您完全確定了一段時間。
- 「評估文件度量標準」:在繼續前檢查文件的數量。在你的情況下,檢查文件計數是否爲9。
我只是想在將數據複製到HDFS之前對文件進行某種檢查。
希望它有幫助:)
1
你不能像你一樣加入轉換。
每次轉換成功後,都會進入虛擬步驟,因此它將被調用以進行每次轉換。
如果你想等到最後轉換完成只有一次Hadoop的文件複製步驟,你需要做兩件事情之一運行:
運行在一個序列中的轉換,其中每個KTR會被稱爲前一個成功(較慢)
正如另一個答案建議,並行啓動KTRs,但有一個警告:他們需要從一個子工作調用。這裏的想法:
你的主要工作有一個開始,調用一個子工作,一旦成功,調用Hadoop複製文件的步驟。
您的子作業有一個開始,所有轉換都是在不同的流程中調用的。您使用「並行啓動下一個條目」,以便一次啓動。
子作業將繼續運行,直到最後一次轉換完成,然後纔將流傳遞到Hadoop複製文件步驟,該步驟只會啓動一次。
相關問題
- 1. 虛擬箱不起作用
- 2. 當虛擬不起作用
- 3. Sql Server的作業步驟
- 4. SQL Server 2008作業步驟
- 5. apache虛擬主機在Mint虛擬機上不起作用
- 6. 遵循所有步驟,但不工作在Windows 7中的虛擬主機
- 7. 作業不會創建虛擬機
- 8. WPF:TreeView虛擬化不起作用
- 9. 安裝到虛擬env不起作用
- 10. Tomcat虛擬目錄不起作用
- 11. 數據虛擬化不起作用
- 12. 虛擬機HA - 虛擬機監控不起作用
- 13. 多步驟搜索在codeigniter中不起作用
- 14. LoadLeveler作業腳本的作業步驟循環?
- 15. 根據作業參數跳過步驟
- 16. 列表作業的未決步驟
- 17. SQL作業步驟比較文件名
- 18. Cron作業不起作用
- 19. 在彈簧批處理作業中使用多線程步驟
- 20. PHP在EC2 + ubuntu + apache2中的虛擬主機上不起作用
- 21. 文件在虛擬服務器中不起作用
- 22. 虛擬機映像中的虛擬機映像全屏不起作用
- 23. SQL Server代理作業:如何在不執行整個作業的情況下執行作業步驟
- 24. 在Spring批處理中的步驟中停止作業
- 25. 爲什麼我的同步作業代碼不起作用
- 26. 查找SQL作業中每個作業步驟的「運行方式」值
- 27. 使用鎖定插件在輸入步驟後排隊作業
- 28. 在SQL Server 2005中添加作業步驟
- 29. spring批量在步驟中添加作業參數
- 30. TSQL-在代碼中重新排列sql作業步驟順序