我已經看到了這個問題的答案,但我無法弄清楚哪個答案會表現最快。這些是我見過的答案 - 哪個最好?使用每個或each_line 在Ruby中讀取大文件的最快方法是什麼?
- 讀取一行得到
- 保存所有到使用readlines方法線的陣列,然後使用每個
- 使用grep(不知道與grep究竟是什麼......)
- 使用sed(不知道究竟是什麼與sed ...
- 還有其他?
另外,使用其他語言還是應該更好?
編輯:
更多細節:每行包含類似 「ID1 attr1_1 attr2_1 ID2 attr1_2 attr2_2 ... IDN attr1_n attr2_n」(n是非常大的),我需要那些插入到數據庫中。對於該示例行,我需要將n行插入到數據庫中。
什麼是「大」文件?你在做什麼?表現是否重要?你有沒有嘗試過基準測試? –
至少* 500,000行和每行數萬個字符。對於每一行,我都會對數據庫做些什麼。性能確實很重要。我沒有做任何基準測試,但我想知道是否有明顯的答案,根據他們的工作方式,哪些答案會更快或更慢。 – user1136342
該文件是本地文件嗎? – gmalette