比方說,我想將百萬篇博客&新聞文章存儲到一個mongodb服務器。Mongodb實時聚合和存儲設計?
這些文章將有一些我可以用於聚合的領域,例如:類別,作者,位置,域等等。我可以將這些文章存儲在mongo數據庫中,但那些文章也有文本,摘要等字段包含相當多的數據,並可能使文檔相當大(仍然< 16MB)
我的問題是什麼時候mongodb運行聚合,它是否將整個文檔讀入內存並從那裏做聚合?顯然,所有來自磁盤的數據都無法放入內存。文檔的大小是否會影響聚合性能?
什麼是良好的設計/替代存儲&「REALTIME」聚合?
我不想爲我的項目使用像Hadoop這樣的批處理過程,因爲實時聚合是必須的。我已經看到了2個mongo dbs的設置,其中1個用於存儲原始文檔的存儲,另一個僅用於星型模式中的聚合存儲字段,但我不太喜歡這種方法,因爲它需要維護2個版本一個文件在2個地方。
謝謝。
這是一個[「太寬泛」](http://stackoverflow.com/help/dont-ask)這樣一個問題。嘗試縮小到某個特定的或可能將其分解成您的問題的一部分。 –