我有一個huuge csv文件(524 MB,記事本打開它4分鐘),我需要更改格式。現在是這樣的:轉換一個巨大的txt文件
1315922016 5.800000000000 1.000000000000 1315922024 5.830000000000 3.000000000000 1315922029 5.900000000000 1.000000000000 1315922034 6.000000000000 20.000000000000 1315924373 5.950000000000 12.452100000000
該行由一個換行符符號劃分,當我把它粘貼到Excel中把它分成線。我會通過使用Excel函數來完成它,但文件太大而無法打開。 第一個值是自1-01-1970以來的秒數,第二個是價格,第三個是volumen。
我需要它是這樣的:
01-01-2009 13:55:59 5.800000000000 1.000000000000 01-01-2009 13:56:00 5.830000000000 3.000000000000
等
記錄需要用空格分開。有時來自同一第二價格的多個值是這樣的:
1328031552 6.100000000000 2.000000000000
1328031553 6.110000000000 0.342951630000
1328031553 6.110000000000 0.527604200000
1328031553 6.110000000000 0.876088370000
1328031553 6.110000000000 0.971026920000
1328031553 6.100000000000 0.965781090000
1328031589 6.150000000000 0.918752490000
1328031589 6.150000000000 0.940974100000
發生這種情況時,我需要代碼從該秒開始取平均價格,並且每秒只節省一個價格。 這些比特幣交易在BTC開始時並不會每秒發生。 當某些秒沒有記錄時,需要創建一個新記錄,其中包含以下第二個記錄,以及從最後一個已知價格和volumen中複製的價格和智能體的值。
然後將所有內容保存到新的txt文件中。
我似乎無法做到這一點,我一直在嘗試在python中編寫一個轉換器幾個小時,請幫助。
你到目前爲止嘗試過什麼?你能向我們展示一些你的代碼,所以我們可以看到我們可以幫助的地方嗎? – serk
沒有什麼我試過讓我甚至完成了10%的工作,所以我什麼都沒有。 –
請你解釋一下'01-01-2009 13:55:59 1586.12 220000 01-01-2009 13:56:00 1586.12 220000'是從輸入中導出的嗎? –