我有一些大的XML文件(5GB〜每個),我正在導入到一個mongodb數據庫。我使用Expat來解析文檔,進行一些數據操作(刪除一些字段,單位轉換等),然後插入到數據庫中。我的腳本是基於這一個:https://github.com/bgianfo/stackoverflow-mongodb/blob/master/so-import如何提高到mongodb的XML導入?
我的問題是:有沒有一種方法來改善這與批量插入?在插入前將這些文檔存儲在數組中會是一個好主意?那麼在插入之前我應該存儲多少個文檔?將jsons寫入一個文件然後使用mongoimport會更快?
我欣賞任何建議。
感謝您的快速響應!我現在開始用數組大小開始「試驗」:) –