任何人在沒有使用EMR的情況下使用DynamoDB和Hive？

但是根據該鏈接，Hive需要在EMR之上進行設置。但是我想知道是否可以使用與獨立Hadoop集羣的集成，而不是使用EMR。有沒有人做過這個？與使用EMR相比，DynamoDB和HDFS中的數據會發生同步問題嗎？

2012-04-18 Arvind

爲了能夠使用它自己的羣集上，則需要自定義StorageHandler爲DynamoDB（它可能包括一個定製SERDE爲好）。

目前似乎不可用，至少在AWS網站上不可用。

你可以做的是使用亞馬遜提供的JDBC interface從你的集羣生成查詢，但它仍然會在EMR之上執行。

2012-04-19 14:45:37

回答