當向數據庫插入大量記錄時，如何編寫節點腳本以減少內存使用量？

假設我想生成一百萬條記錄並將它們插入數據庫。如果需要一個小時，沒問題。當向數據庫插入大量記錄時，如何編寫節點腳本以減少內存使用量？

我已經得到了生成假的零售數據庫：

var records = retailGen.generateOrders(numberOfRecords);

確定這是沒有問題的，它可以產生一百萬條記錄相當迅速。當我排隊了大量的記錄，並遍歷這些問題就來了（每個記錄包含一個或多個事務，insertTransaction是一個異步調用DB）：

_fn = function(record) { 
    var transaction, _j, _len, _ref, _results; 
    _ref = record.transactions; 
    for (_j = 0, _len = _ref.length; _j < _len; _j++) { 
     transaction = _ref[_j]; 
     insertTransaction(transaction); 
    } 
    }; 

    for (n = _i = 0; 0 <= runs ? _i < runs : _i > runs; n = 0 <= runs ? ++_i : --_i) { 
    _fn(records[n]); 
    }

它就會堆積所有這些異步調用了並淹沒內存，最終導致操作系統癱瘓，以至於我無法做任何事情。我想知道更多有經驗的js程序員如何解決這個問題。該腳本有效，但數量變大時效果不佳。

我寧願用純js而不是圖書館來解決這個問題 - 這將是一個更好的學習體驗。我考慮將下一個記錄的插入插入到第一個插入的「完成」回調中，但接下來感覺就像是強制節點是同步的（很好，非常同步）。

來源

2014-06-11 jcollum

當我插入「硬採集」大數據量首先我傾向於給他們一個PHP scipt，大塊成爲甚至部分，並將其放入一個文件。

現在這可能聽起來浪費資源，但你幾乎不會出錯序列化數據。因此，直到這一點，沒有什麼可以打破。我假設收集大量的數據，你可能會得到意想不到的「事情」。

比我逐行獲取序列化文件，反序列化並插入它。

如果有什麼應該在中間斷開：我有數據重現錯誤，並且不會發生數據丟失。

我可以睡覺tospare CPU，限制塊中的數據量。

這就是我如何去做的。

來源

2014-06-11 23:39:21 Sesertin

是的，這與我所做的相似：我只是在bash腳本中放置一個循環並調用節點腳本。不喜歡這個解決方案，覺得我應該能夠做得更好。 – jcollum

更快更快或者你的意思是？你更好的目標是什麼？ – Sesertin

不訴諸bash腳本等我想知道如何做這種節點的速率限制。 – jcollum

當向數據庫插入大量記錄時，如何編寫節點腳本以減少內存使用量？

回答

相關問題