2011-12-04 50 views
2

我正在做一個處理大量數據的項目。我正在考慮在Ec2上主辦這個項目。我打算使用Hadoop來執行計算,並使用一些NoSql系統(例如Hbase/Cassandra)來存儲數據。 NoSql系統必須是持久性的(我不想丟失我的數據)。據我所知,我需要產生虛擬機來承載Hadoop和NoSql的東西。但是虛擬機並不是持久的。有沒有其他的方式可以持久地存儲數據存儲系統(不僅是數據,還有管理數據的系統)並利用Amazon提供的計算?如何在Amazon上託管持久性數據存儲系統

我想我的情況與持續託管數據庫的人相似。

回答

1

我想你需要看看使用「預留實例」和「Elastic Block Store」(EBS)。

http://aws.amazon.com/ec2/reserved-instances/

http://aws.amazon.com/ebs/

如果我正確理解你的問題,你想保留的情況下,你總是保持運行連接到EBS卷爲您的數據的持久化存儲。 EBS能夠爲S3提供備份「快速預定」。

+0

我想要的是有一個持久的方式來存儲數據和我可以獲取數據的運行系統。根據我的理解,「預留實例」是我可以保留一段時間(至少1年)的一個實例。如果是這樣的話,這可能是一個解決方案。順便說一句,人們通常如何在雲端託管他們的數據庫? – user1080611

+0

直到您在EC2上開發了一個系統並確定您要在相當長的一段時間內使用相同的實例類型並且想要少付一點費用時,才需要購買預留的實例。您可以在不購買保留實例的情況下儘可能長時間使用EC2實例,並且在完成之前很可能需要更改實例類型。 –

+0

AWS不保證雖然未保留的實例。雖然它的可能性不大,但您的按需實例將會「啓動」......從我的理解來看,這也不是問題。如果我在這裏錯了,請糾正我。 –

0

Amazon提供名爲SimpleDB的服務,您可以使用該服務持久且靈活地存儲數據。根據您的數據要求,您可能也可以使用Amazon S3。

相關問題