我有一個40MB的數據框「dfScore」我寫這封信的.xlsx。 代碼如下,寫入數據框中原來的.xlsx太慢
writer = pandas.ExcelWriter('test.xlsx', engine='xlsxwriter')
dfScore.to_excel(writer,sheet_name='Sheet1')
writer.save()
代碼dfScore.to_excel
需要將近一個小時,the code writer.save()
需要一個小時。這是正常的嗎?有沒有一種好的方法可以少於10分鐘?
我已經在stackoverflow中搜索,但它似乎有一些建議不能解決我的問題。
數據幀的大小是4百萬行乘5列。嘗試寫入csv並比較時間。 – Merlin
現代excel電子表格只能處理1,048,576行。 –
它不是太慢,它卡住了。它已經死了。你正在寫更多的行,而不是excel可以處理的。這導致了Excel作家默默無聞地等待着一個永遠不會發生的奇蹟。將數據框分成不同的位並將它們作爲單獨的工作表編寫,或者使用其他格式(例如csv),或使用一些統計工具壓縮數據框以使其適合於excel。 – Kartik