我想在MongoDB中有效地存儲原始JSON流(通過Twitter或NYTimes),以便我可以稍後使用Lucene或Hadoop將數據(NYTimes文章或Tweets /用戶名)編入索引。在Mongo中存儲數據的最明智的方式是什麼?我應該只用JSON管道,還是有更好的?我只用一臺機器做mongodb,有3個副本。如何在MongoDB中有效存儲和查詢原始JSON流?
是否存在編寫查詢或存儲我的數據以更好地優化搜索查詢的高效(智能)方式?
我想在MongoDB中有效地存儲原始JSON流(通過Twitter或NYTimes),以便我可以稍後使用Lucene或Hadoop將數據(NYTimes文章或Tweets /用戶名)編入索引。在Mongo中存儲數據的最明智的方式是什麼?我應該只用JSON管道,還是有更好的?我只用一臺機器做mongodb,有3個副本。如何在MongoDB中有效存儲和查詢原始JSON流?
是否存在編寫查詢或存儲我的數據以更好地優化搜索查詢的高效(智能)方式?
是否存在編寫查詢或存儲我的數據以更好地優化搜索查詢的高效(智能)方法?
這完全取決於你需要做什麼樣的查詢以及你的應用程序的使用模式。 在包含以下內容的Mongo文檔中存儲每條推文會非常簡單: 根據您需要進行的查詢,您需要在這些字段上創建索引(更多信息:http://www.mongodb.org/display/DOCS/Indexes)
對於全文搜索,您可以標記/解析/干擾推文的文本,並存儲一系列標記,每條推文都可以通過索引快速查詢。 如果您需要更強大的全文搜索功能,您還可以使用Lucene對它們進行索引並將objectId存儲在每個lucene文檔中 - 但是這引入了實質上具有2個數據存儲庫的複雜性
再次,這裏確實沒有正確的答案不知道用例的細節。
「對於全文搜索,您可以標記/解析/推文的文本並存儲一系列令牌,每條推文都可以通過索引進行快速查詢。「這是一個非常好的建議,謝謝! – vgoklani
該示例使用PHP,但您可能會發現這很有用:http://learnmongo.com/posts/mongodb-php-twitter-part-1/ –