0

我需要每隔幾個小時備份6個DynamoDB表。我從模板創建了6個管道,並且它運行得非常好,只是它創建了6個或更多的虛擬機,這些虛擬機大部分都處於運行狀態。這不是我能負擔得起的經濟。在DynamoDB表備份期間限制AWS數據管道使用的EC2資源

有沒有人有過優化這種場景的經驗?

+0

您需要使用以下Rohit建議的第三個選項。在同一個EMR集羣上運行多個活動的單個管道。然後您可以控制整個羣集的大小進行調整。 – panther

回答

0

浮現在腦海中的一些解決方案是:

一: 爲了確保EC2資源被終止,可以設置在EC2資源定義的terminateAfter財產。這裏討論終止之後的語義 - How does AWS Data Pipeline run an EC2 instance?

兩個: This thread在AWS論壇上討論了數據管道如何使用現有的EC2實例。

三: 使用備份管道模板始終創建一個單一管道,其中單個Activity用於從單個源讀取並寫入單個目標的備份。您可以在AWS控制檯中查看管道的JSON源,並使用多個活動實例編寫一個類似的管道,其中一個用於要備份的每個表。由於管道定義只有一個EMR資源,因此只有該EMR資源才能完成所有活動的工作。