我從以下各列的.csv文件中讀取一個數據框:Python的熊貓:多指標拆散到永遠
columns = ['Year', 'month', 'column1', 'column2','column3', 'column4', 'column5', 'column6', 'column7', 'column8','Value']
數據框有116408行,但df = df.drop_duplicates()
後,它現在有98829(我不「知道爲什麼它在首位重複)
我要拆散它是這樣的:
1 2 3 ....
2016 2017 2018 2016 2017 2018 2016 2017 2018 ....
column1 column2 .......
a1 a2 ... 24 12 20 22 15 21 12 11 13 ...
b1 b2 ... 18 11 21 21 11 31 14 41 14 ...
到目前爲止,我已經試過:
df = df.set_index(columns[:-1], append=True)
df = df.unstack(level=[0,1])
但這需要永遠。 (如果我刪除append
一個得到這個錯誤:ValueError: Index contains duplicate entries, cannot reshape
)
有沒有人有另一種選擇或任何想法,爲什麼它需要這麼久? 我還沒有看到結果,也沒有任何錯誤。
也許'df.to_dict(10)'和粘貼在這裏輸出,所以我們可以複製你的數據嗎? –
我有想法。但是,我猜測。我不想花時間猜測。你可以通過提供樣本數據來解決這個問題。對你的好處是你可以提高獲得更高質量答案的機會。 – piRSquared
我們無法幫助您...直到看到數據.. – Wen