我是新來的Python,我不確定爲什麼我看到內存使用率大幅上升,當我使用Numpy hstack
將兩個pandas
數據幀連接在一起。與pandas.concat
的表現更糟 - 如果它完成 - 所以我使用NumPy。Numpy hstack爆炸內存
這兩個數據幀是比較大的,但我有20 GB免費RAM(使用11GB,包括我想複製的兩個數據幀)。
數據幀a和b具有形狀:
a.shape (66377, 30)
b.shape (66377, 11100)
當我使用np.hstack((a,b))
自由20GB是不得不被完全用完。
什麼數據的'dtype'?對於float64,'b'應該大約5.5 GB,所以'np.hstack'的結果也應該只增加大約5.5 GB。 – JoshAdel
他們是float64 –