2017-09-26 65 views
0

我使用Python 2.7的openpyxl來打開並修改現有的.xlsx文件。這個excel文件有大約2500列和10行。問題是openpyxl花了很長時間來加載文件(差不多1分鐘)。無論如何加快了openpyxl的加載過程。從其他線程,我發現了一些read_only和write_only的提示。但是我必須同時閱讀和寫作excel,所以我不能將這些技巧應用於我。有沒有人有任何建議。非常感謝你Openpyxl加載現有的Excel需要太長時間

+0

不是真的,但它可能取決於文件中的其他內容。 25000個單元格的加載速度非常快,但是您可能還會在文件中加載其他項目。 –

回答

-1

我不知道你需要用Excel文件做什麼,但我會嘗試打開.xmls文件作爲熊貓據幀:

import pandas as pd 
df = pd.ExcelFile('file path') 
+0

Pandas Excel的支持受xlrd支持的限制,這只是文件格式的一個子集。 –

+0

使用熊貓打開偏離過程更快,但打開後我必須讀取所有單元格(逐個單元格)並將註釋寫入excel for severals單元格(而不是逐段或逐列)。熊貓可以嗎? – leanh2

0

我有什麼做用蟒打開excel文件(超過2k列,大約2.5MB),然後將excel中的值與幾個.xml文件中的值進行比較。差異將作爲excel中的註釋寫入。 在Excel中只有文本,數字和一些格式(單元格背景顏色)。我將嘗試刪除excel中的所有格式以查看它是否加快了openpyxl的加載速度。

+0

我在python中做了一個簡單的測量。用xlrd打開這個excel文件花了4秒,用openpyxl 22.5秒。是openpyxl如此緩慢 – leanh2