2013-03-01 241 views
6

我是DynamoDB的新手,我想知道從這個鍵/值對數據存儲中生成報表比從DBMS生成報表有什麼不同。從Dynamodb生成報告

My(Java)應用程序將數據寫入DynamoDB,我希望能夠生成業務報告(例如銷售報告)。

我的理解是Amazon提供了EMR(彈性Map Reduce),進一步的閱讀是它具有Hive,它下面將允許我使用SQL語法來查詢DynamoDB。

我的數據應該少於50GB,是否正在使用EMR來矯正這項任務?

回答

7

是配置單元使用SQL類似的語法。 Hive仍然使用java編寫,並且仍然是java。 Hive wiki是一個好地方start.Here是關於使用DB迪納摩與EMR http://aws.amazon.com/articles/28549

如果我的數據是小於50GB,使用EMR承擔這一任務的矯枉過正的好文章?

我不這麼認爲,一旦你有EMR設置,並已經將發電機表導出到s3或內部hadoop表。然後您可以查詢S3或內部hadoop表,而不影響DynamoDB的臨時吞吐量。由於S3非常快,您可以編寫各種複雜的配置單元查詢來獲取所需的報告。

The command line tool啓動EMR非常容易設置,如果您想省錢,您可以隨時競標現貨實例。

另外,當作業運行緩慢時,如果需要,可以增加核心和任務節點以使作業快速運行。