我有一系列文件,這些文件是按以下格式:Python的遍歷多個文件
file_1991.xlsx
file_1992.xlsx
# there are some gaps in the file numbering sequence
file_1995.xlsx
file_1996.xlsx
file_1997.xlsx
因爲我想這樣做的每個文件:
import pandas as pd
data_1995 = pd.read_excel(open(directory + 'file_1995', 'rb'), sheetname = 'Sheet1')
做了一些工作數據,並將其保存爲其他文件:
output_1995 = pd.ExcelWriter('output_1995.xlsx')
data_1995.to_excel(output_1995,'Sheet1')
而不是做所有這些對於每一個文件的,我怎麼能經過多個迭代文件並在多個文件中重複相同的操作?換句話說,我想遍歷所有的文件(它們主要遵循名稱中的數字序列,但序列中存在一些空白)。
感謝您的幫助提前。
謝謝!我可以使用'glob'模塊來分配變量名嗎?例如,我需要通過分配類似如下內容來讀取文件: 'data_1995 = pd.read_excel(open('file_1995.xlsx'),sheetname ='Sheet1')' –
@kfp_ny您爲什麼要這樣做?你需要重新考慮你的程序。 –
@kfp_ny不,你不能,但如果你想保留文件,你可以使用一個字典,並在文件名後面命名鍵值,如果你想創建一個關係。但我建議不要這樣做,並找到一種方法來保持它的動態,如果可以的話,因爲每個文件都將被加載到內存中,否則您將遇到同樣的問題。 – umutto