我有一個數據幀df
具有以下結構:熊貓數據幀樞軸 - 存儲器錯誤
val newidx Code
Idx
0 1.0 1220121127 706
1 1.0 1220121030 706
2 1.0 1620120122 565
它具有百萬行。 總共我們有600個獨特的Code
值和200000個獨特的newidx
值。
如果我執行以下操作
df.pivot_table(values='val', index='newidx', columns='Code', aggfunc='max')
我得到一個MemoryError
。但這聽起來很奇怪,因爲生成的數據幀的大小應該是可持續的:200000x600。
有多少內存需要這樣的操作?有沒有辦法解決這個內存錯誤?看到
您有1.2億個項目。 4個字段,我不確定,但我會說每行接近4Gb的32個字節。那麼你是否運行一個32位版本的Python或64位? –
32位,在一臺4-GB的計算機上.. –
它是真正低規格的問題,你有。如果答案不充分,就會出現一個令人討厭的解決方法。 –