我有一個包含1300萬行的CSV文件。數據不是引用封裝的,它包含換行符,這會導致一行數據有換行符。數據不會每行有多箇中斷,只有一箇中斷。如果文件的下一行包含一個字符串,請將其附加到當前行的末尾
我會如何採取這樣的數據?
Line of data
Line of data
continuation of previous line of data
Line of data
Line of data
continuation of previous line
Line of data
,把它變成這樣:
Line of data
Line of data continuation of previous line of data
Line of data
Line of data continuation of previous line
Line of data
我已經存放在變量行和處理下一個,尋找第一個字符是什麼,但「L」這個測試並追加它。我也嘗試使用f.tell()
和f.seek()
在文件中移動,但我一直無法使它工作。
重新制定:如果下一個字符串以空格開頭,則爲延續。順便說一句,['csv'模塊](https://docs.python.org/3/library/csv.html)是否已經處理了這個問題? – 9000
我無法使用CSV模塊,因爲它們沒有用每列的引號進行封裝,而列值有時包含一個或多個逗號。我不得不做很多格式來正確地分割它。編輯:是的我已經嘗試解決源數據問題......這是一個沒有結果的努力 – Taylor
[這個答案](http://stackoverflow.com/a/3788876/1248974)適用於你的簡短的示例數據,不確定我們要如何處理1300萬行 – davedwards