我剛剛按照本指南進行操作:http://rogueleaderr.tumblr.com/post/32768181371/set-up-and-run-a-fully-distributed-hadoop-hbase-cluster以在運行hadoop和hbase的Amazon EC2上設置集羣。亞馬遜EC2和S3:如何讀取和寫入數據
我現在想知道的是如何在我的羣集上運行hbase中的數據?我是否需要將它加載到S3中,然後將其加載到我的hbase集羣中?
是否有加載/提取數據的最佳做法?任何類型的指針將不勝感激,因爲我是新的EC2。
有沒有你不使用Amazon的彈性MapReduce的一個原因?如果您不熟悉在AWS上運行Hadoop,您可能會發現更容易使用它。以下是適用於MapReduce的AWS入門指南:http://docs.aws.amazon.com/ElasticMapReduce/latest/GettingStartedGuide/Welcome.html這是一個有用的教程:http://aws.amazon.com/code/Elastic -MapReduce/2273 – Daan
@Daan我正在將我們的組代碼移動到amazon ec2上,我們已經擁有了我們自己的MapReduce基礎結構,我們希望使用它。 –