2012-04-18 35 views
2

我正在閱讀使用Hive在DynamoDB上查詢數據的以下集成。 http://aws.typepad.com/aws/2012/01/aws-howto-using-amazon-elastic-mapreduce-with-dynamodb.html任何人在沒有使用EMR的情況下使用DynamoDB和Hive?

但是根據該鏈接,Hive需要在EMR之上進行設置。但是我想知道是否可以使用與獨立Hadoop集羣的集成,而不是使用EMR。有沒有人做過這個?與使用EMR相比,DynamoDB和HDFS中的數據會發生同步問題嗎?

回答

0

爲了能夠使用它自己的羣集上,則需要自定義StorageHandler爲DynamoDB(它可能包括一個定製SERDE爲好)。

目前似乎不可用,至少在AWS網站上不可用。

你可以做的是使用亞馬遜提供的JDBC interface從你的集羣生成查詢,但它仍然會在EMR之上執行。

相關問題