我有一個約500,000行的excel文件,我想將其拆分爲幾個excel文件,每個文件有50,000行。熊貓 - 拆分大型excel文件
我想用熊貓做,所以它會是最快最簡單的。
任何想法如何使它?
感謝你的幫助
我有一個約500,000行的excel文件,我想將其拆分爲幾個excel文件,每個文件有50,000行。熊貓 - 拆分大型excel文件
我想用熊貓做,所以它會是最快最簡單的。
任何想法如何使它?
感謝你的幫助
假設您的Excel文件只有一個(第一)片包含數據,我會利用chunksize
參數:
import pandas as pd
i=0
for df in pd.read_excel(file_name, chunksize=50000):
df.to_excel('/path/to/file_{:02d}.xlsx'.format(i), index=False)
i += 1
UPDATE:
chunksize = 50000
df = pd.read_excel(file_name)
for chunk in np.split(df, len(df) // chunksize):
chunk.to_excel('/path/to/file_{:02d}.xlsx'.format(i), index=False)
你excel文件只有一張數據表? – MaxU