0
我正在利用DynamoDB和EMR創建一個跟蹤消費者產品用戶統計信息的應用程序。我希望能夠做到像查找上週每天有超過20條評論的所有帳戶。我目前的想法是使用帳戶ID作爲散列鍵和時間作爲我的範圍鍵 - 我將平整時間,以便它們符合日/小時/周的時間間隔並將事件數據彙總在一個項目中。我計劃能夠跟蹤多個事件。在事件中使用本地次要標記會是一個好主意嗎?DynamoDB本地二級索引pro/cons?
我正在利用DynamoDB和EMR創建一個跟蹤消費者產品用戶統計信息的應用程序。我希望能夠做到像查找上週每天有超過20條評論的所有帳戶。我目前的想法是使用帳戶ID作爲散列鍵和時間作爲我的範圍鍵 - 我將平整時間,以便它們符合日/小時/周的時間間隔並將事件數據彙總在一個項目中。我計劃能夠跟蹤多個事件。在事件中使用本地次要標記會是一個好主意嗎?DynamoDB本地二級索引pro/cons?
它們被稱爲本地二級索引,因爲它們仍然只在主鍵的上下文中工作。查詢find all accounts
意味着您仍然需要全表掃描。
您是否在考慮使用評論數作爲LSI?
是的,這就是主意 - 我想我自己製作的查詢是這樣的:在一週前和今天之間的任何特定日期,查找20個以上上傳的所有帳戶。我希望我的情況會類似於這裏描述的情況:http://www.allthingsdistributed.com/2013/04/dynamdb-local-secondary-indices.html但從你說的看起來像那不是案件。更多地思考它,我不認爲這對我的情況是必要的 - 這就是我將使用EMR的原因。感謝你的回答! – abu
他的示例查詢仍然通過HashKey進行查詢。例如:「向我展示約翰打過的最後10場比賽」和「讓我看看約翰的歷史前5分」。您的等價物是「向我展示任何人玩過的最後10場比賽」或「向我展示所有玩家的所有前5分」。 – prestomation