我目前有5個CSV文件,每個文件約有45,000條記錄。最好的方法是什麼?我之前完成了I/O,但從來沒有在這個規模上。解析成矢量字符串?讀取大型CSV文件的有效方法?
回答
是的,將它們讀入vector
將是合理的。
存儲的選擇確實取決於您計劃要做什麼以及數據是什麼。如果您知道數據的格式是什麼,您可能需要創建一個struct
,並將數據讀取到更有組織的形式。例如。如果該文件是這樣的:
name, score, err
Mats, 89, 2.1%
Steve, 79, 8%
,那麼你可以有這樣的結構:
struct Row
{
string name;
int score;
float err;
}
正如評論說,45K線不是非常多,它應該不會造成什麼大問題除非你使用手錶的計算能力來運行它。
只要繼續做你正在做的事情:讀所有線路,string
的Vector
一個S,string
的Vector
一個s的Vector
,或對象的Vector
。我們正在談論200到500 MB RAM,而現在大多數電腦的可用性遠遠超過了這個數字。從處理時間的角度來看,普通計算機的處理時間爲5到10分鐘(當然取決於處理的數量)。
如果遇到任何問題,請提出一個有更多信息的新問題。
咦? 45K記錄需要200-500MB?這是每行2-11KB。聽起來相當多。每行13毫秒來處理它? –
我剛拿了一張有48K記錄的數據庫表格,並將其導出爲CSV格式,其中一個字段是「通知」(基本上,要發送到電子郵件的文本發送給網站的客戶端),以及總數10個領域。該文件是216MB。 –
閱讀這個文件,用一個簡單的程序,我剛剛砍了0.4s。 –
- 1. 讀取R中的大型csv文件
- 2. 在Java中讀取大型CSV文件
- 3. 在PHP中讀取大型CSV文件
- 4. 閱讀大型csv文件
- 5. 閱讀大型CSV文件
- 6. PHP有效地讀取csv文件
- 7. Python:這是讀取大型.csv文件的最佳方式?
- 8. 讀取csv文件的更好方法
- 9. 任何從大型二進制文件讀取數據的有效方法?
- 10. 雙讀取大CSV文件
- 11. 如何有效地讀取和重新綁定大型CSV文件?
- 12. Android - 更高效的方法來讀取大文本文件
- 13. 有效地讀取C++中的大型電子表格文件
- 14. 無法讀取csv文件
- 15. 在Java中按行讀取大型JSON文件的快速高效的方法
- 16. 高效地讀取巨大的csv文件?
- 17. 使用PHP獲取部分CSV文件的有效方法
- 18. 向後讀取大文本文件的最有效方法是什麼?
- 19. 閱讀PHP中的大csv文件,無法讀取
- 20. NodeJS:讀取一個大的csv文件
- 21. OleDb - 讀取CSV文件的大問題
- 22. 反轉大文件的有效方法
- 23. 將大型csv文件讀入R
- 24. 讀取大型XML文件
- 25. 讀取大型xml文件的最快方法
- 26. 讀取大文件和splitby方法
- 27. 使用熊貓高效讀取大型CSV文件而不會崩潰
- 28. 讀取R中的大型CSV文件時出錯
- 29. 使用緩衝讀取器的大型.csv文件,Python
- 30. 從PHP中的大型CSV文件讀取多列
你的約束是什麼?你有足夠的記憶嗎?多少,如果你不知道是否足夠? –
在本網站上討論過很多次讀取CSV文件。你看過這些方法嗎?如果是的話,他們有什麼問題? – Borgleader
你試過了什麼?它太慢了嗎? 45,000條記錄聽起來並不像需要特別關注的大型數據集。 –