我使用AWS Data Pipelines運行夜間SQL查詢,該查詢爲彙總統計信息填充表。用戶界面有點時髦,但最終我找到了工作。 現在我想用python腳本做類似的事情。我有一個文件,我每天早上在我的筆記本電腦上運行(forecast_rev.py),但當然這意味着我必須打開我的筆記本電腦,並每天踢這個。當然,我可以安排一條管道做同樣的事情,從而放假休假而不在乎。 對於我而言,我無法找到關於此的教
有沒有辦法在現有集羣上的AWS Data Pipeline中運行EmrActivity?我們目前正在使用數據管道來使用EmrCluster和EmrActivity在AWS EMR中運行作業,但我們希望所有管道都在同一個羣集上運行。我嘗試閱讀文檔並在架構師中建立管道,但我似乎無法找到一種方法去做任何事情,但創建一個集羣並在其上運行作業。似乎沒有辦法定義使用現有集羣的新管道。如果有我該怎麼做?我們目前