1
我有一個Amazon EMR作業流程執行三個任務,第一個輸出是輸入到後續兩個任務。第二個任務的輸出由第三個任務DistributedCache使用。Amazon Elastic Map Reduce:作業流失敗,因爲輸出文件尚未生成
我創建了工作流完全在EMR網站(控制檯),而是因爲它找不到分佈式緩存文件集羣立即失敗 - 因爲它尚未被步驟#1中創建。
是我通過自舉操作來創建從CLI這些步驟,並指定--wait-for-steps
選項唯一的選擇?看起來很奇怪,我不能執行一個任務的輸入依賴於另一個任務的輸出的多步驟工作流程。