我正在用Apache Storm評估Mongo DB。我的用例是我必須從Apache Storm中的MongoDB中讀取數據,在bolt中做一些處理並將其轉儲到Neo4J圖形數據庫中。Mongodb oplog同步
我使用的是蒙戈噴口,這將從OPLOG文件中讀取數據。我查看了主節點將數據寫入oplog文件的文檔,並且副本讀取將以異步方式發生。我知道oplog是一個封閉的集合(指定的大小),數據以很高的速度寫入oplog,同步到副本集有點慢。如果oplog達到其最大大小,它會覆蓋文件開頭的文檔。在異步過程中,如果我們獲得其他數據,並且複製仍處於完成狀態,則可能會丟失複製集,因爲它不會同步。
我在這裏的問題是
1)有什麼辦法來克服這個?
2)使用Apache Storm時,我們可以如何更好地使用這個加蓋的集合?
3)如果給最大OPLOG大小如我給500GB和OPLOG擁有1GB的數據將其佔領和大小的儲備500GB?
4)這是我的用例的正確解決方案嗎?
在此先感謝!