2016-12-25 76 views
1

我有一個約500,000行的excel文件,我想將其拆分爲幾個excel文件,每個文件有50,000行。熊貓 - 拆分大型excel文件

我想用熊貓做,所以它會是最快最簡單的。

任何想法如何使它?

感謝你的幫助

+0

你excel文件只有一張數據表? – MaxU

回答

6

假設您的Excel文件只有一個(第一)片包含數據,我會利用chunksize參數:

import pandas as pd 
i=0 
for df in pd.read_excel(file_name, chunksize=50000): 
    df.to_excel('/path/to/file_{:02d}.xlsx'.format(i), index=False) 
    i += 1 

UPDATE:

chunksize = 50000 
df = pd.read_excel(file_name) 
for chunk in np.split(df, len(df) // chunksize): 
    chunk.to_excel('/path/to/file_{:02d}.xlsx'.format(i), index=False) 
+0

抱歉的延遲,但由於某種原因,它會引發一個錯誤,說'讀取一個Excel文件塊沒有實現'任何想法? – TheDaJon

+0

@TheDaJon,你的熊貓版本是什麼:'pd .__ version__'? – MaxU

+0

0.17.1這是我的版本 – TheDaJon