我有幾個(1-5)非常寬(〜50,000列).csv文件。文件大小(.5GB-1GB)(平均大小約500MB)。我需要對預先指定的列上的文件執行連接。效率當然是關鍵。任何可以擴展以有效地允許多個連接列的解決方案都是一種獎勵,儘管目前尚不需要。下面是我輸入:如何使用C/C++有效地連接巨大的csv文件(1000列x 1000行)?
-Primary文件
-secondary文件(S)
主文件(名稱或山坳位置。)
輔助文件 - 加入柱 - 加入柱(姓名或職位)
-Left加入或內部加入?
輸出= 1個文件與多文件的結果加入
我期待解決使用基於C語言的問題,但當然的算法解決方案也將是非常有益的。
「Yikes」是我可以貢獻給這一個... – Alex
有一個C++實現已經這樣做:http://code.google.com/p/csvfix/該源可供下載。 – Cheesebaron
如果你的CSV文件很簡單(不需要引用,沒有逗號),而且你在Linux世界,你可以通過剪切,粘貼和排序來獲得 - 無需編寫C代碼。 – Arkadiy