2017-02-18 54 views
1

我想使用定製AMI(碼頭?)爲執行深度學習培訓任務推出多個Amazon EC2現貨實例(車隊?)。爲了訓練模型,我希望所有實例都共享一組通用文件。使用AMI和公用文件的亞馬遜EC2現貨實例車隊

當由於價格限制/需求導致現貨實例被AWS終止時,這裏的想法並不是失去培訓歷史並在EBS(網絡驅動器?)中保留備份。任務狀態可以在文件中更新,然後在實例可用時恢復。

是否可以啓動所有實例並讓它們協同工作來完成培訓任務?什麼樣的設置可以實現這一點?

回答

2

首先,您可能會對來自AWS Marketplace的Deep Learning AMI感興趣,該Marketplace可通過深度學習工具完全配置。

如果您使用的軟件希望將其數據保存到本地文件系統(而不是Amazon S3),則可以使用Deep Learning AMI在多個Amazon EC2實例(包括競價型實例)之間共享文件系統。 Amazon EFS與NAS相似,可以跨多個實例同時使用。

EFS卷可以通過User Data script連同安裝腳本一起加載並運行所需的應用程序(比創建新的AMI更容易)。

+0

感謝您指出DL AMI。您的意見非常感謝。正如我所看到的,現場實例車隊是AWS中非常有價值和成本效益的工具。我將在這個主題上進行實驗並發表我的學習內容。我也在研究他們的API來自動執行一些任務。 –

+0

嗨@SampathVanimisetti,如果這個或任何答案已經解決了您的問題,請點擊複選標記考慮[接受它](http://meta.stackexchange.com/q/5234/179419)。這向更廣泛的社區表明,您已經找到了解決方案,併爲答覆者和您自己提供了一些聲譽。沒有義務這樣做。 –

+0

道歉!你可能已經注意到了,在這裏新的東西。我嘗試了upvoting,但似乎我需要聲譽點才能夠這樣做。我已經接受了答案。 –