我在尋求關於流程編排最佳實踐的建議。爲了給一些方面,我有以下任務,以協調:Azure Process Orchestration
- 擴展Azure的批次池提供足夠的節點
- 執行自定義.NET代碼調用服務器來檢索任務的列表。這些任務每天都在變化。將這些任務排隊到批處理池。
- 在批處理池中執行每個任務(自定義.Net代碼)。每個任務都會在Azure存儲帳戶中創建數據。
- 縮小批處理池,因爲它不再需要。
- 開始/放大數據倉庫
- 批量將數據導入數據倉庫(期望使用PolyBase和BCP的組合)。
- 彙總數據並生成輸出到Azure存儲帳戶。
- 暫停/縮小的數據倉庫
我目前比較數據倉庫來運行手冊來進行上述操作。
我發現Runbooks在設計和運行時的可視化方面非常原始。
我發現數據倉庫更具視覺效果。但是,數據分割看起來過於龐大。我只是希望每天早晨在上午8點執行流程。我不希望它在過去的幾天中試圖執行(例如,如果我修改模板)。我希望數據倉庫能夠更好地處理活動流水線上的失敗/恢復。
我還有其他方法可以考慮嗎?
感謝 大衛
感謝您的回覆。足夠快樂地寫出自定義.Net。在將此標記爲答案之前,Runbook除外,是否還有其他用於Process Orchestration的Data Factory替代方案? 我不喜歡Data Factory的切片方面(可能是因爲缺乏理解),但擔心諸如「不要在sat/sun上運行」等問題,或者如果我在過去使用startDate創建管道,它也想運行以前的所有日期......當我真的希望它從今天開始(我知道我可以用正確的startDate創建它,但是關心修改現有的日期)。 – DavidReid
PowerShell是你的朋友。如果需要,您可以使用ADF cmdlet覆蓋切片。 –