我想通過閱讀文本文件裏建立一個多指標DataFrame
。它更快創建多索引,然後使用df.loc[[],[]]
文本文件數據分配給它,或連接行至DataFrame
並在年底設定的DataFrame
的指數?或者,使用列表或dict
在從文件讀取數據時存儲數據的速度更快,然後從它們創建DataFrame
?是否有更pythonic或更快的選項?從文本文件中讀取數據並將其分配給數據框的最快方式是什麼?
示例文本文件:
A = 1
B = 1
C data
0 1
1 2
A = 1
B = 2
C data
1 3
2 4
A = 2
B = 1
C data
0 5
2 6
輸出數據幀:
A B C data
1 1 0 1
1 2
1 2 1 3
2 4
2 1 0 5
2 6
更新1月18日:這一點與How to parse complex text files using Python?我也寫了blog article explaining how to parse complex files to beginners。
也許你可以使用['timeit'(https://docs.python.org/3/library/timeit.html)模塊,以測試它。 –
文本文件有多大? –
@MartinEvans的100 MB的順序 – bluprince13