2013-04-05 117 views
1

我計劃託管一個網站,並希望將HBase用作我的數據庫。該網站是一個照片分享/託管的東西,我不想使用任何RDBMS。我想獲得一些關於託管,學習HBase以及Web開發人員和後端設計人員所面臨和解決的問題的經驗。Hbase on AWS EC2

總之,我想創建並託管在Python + HBase的一個網站,學習他們

我曾與EC2和S3的經驗,我會使用AWS作爲基礎設施的目的。

我在想什麼保留的:

  • 3默認值(1.7克)的實例爲HBase的
  • 3個用於Web服務器+ memcached的如果需要的話

我想,如果要弄清楚他們可以開始。當然,隨着時間的推移,如果需要,我會做基準測試,代碼優化和購買更大的實例(如果我能負擔得起)。

截至目前,如果針對1000個用戶,上述規格看起來好嗎?

用戶將會看到照片或添加評論,除了上傳他們的照片。假設一位用戶每週平均上傳20張照片。

我在尋找像答案:「不,HBase的可以在短短一箇中等大小的實例幾千個用戶運行......」或「1000個用戶哦,我的上帝只有3個默認的服務器......」

回答

2

1000個用戶總數,或1000個用戶併發?您的設置應該適用於總共1000個用戶。對於EC2上的HBase:我強烈建議在Elastic Map Reduce上運行HBase(http://aws.typepad.com/aws/2012/06/apache-hbase-on-emr.html)。這樣做可以節省您的時間,無需配置自己的EC2羣集。相信我,我已經做到了這一點,並且不能推薦足夠的EMR方法。 :)

+0

在EMR上運行HBase以獲得高可用性服務是不可能的,因爲主節點沒有故障切換機制,並且如果遇到任何問題,AWS只會終止整個集羣。 – vascop 2017-02-04 18:47:40

+0

@vascop - 當你發佈時,這可能不可用,但據稱https://aws.amazon.com/emr/mapr/提供Hadoop HA(據說因爲我測試它之前我不相信任何東西)。 :) – 2018-01-12 19:43:07