1
我想將熊貓表保存在一個文件中,以便以後可以從該文件讀取它。我的要求:格式以便乾淨地保存和恢復DataFrame?
文件格式應該是體面便攜式(Windows/Linux上好的庫支持主要語言)
我看應該是絕對等同於一個我救
數據幀
據this post,read_csv
和to_csv
可以工作,如果我提供index_col=0
的說法,但數據類型失去了(當然,自動類型推斷並不瓜拉ntee給我相同的類型even for simple types,更不用說如果我使用像從未推斷的list
這樣的python對象)。
是否有一些簡單的解決方案可以正常工作,而不必擔心很多邊緣情況?
我能想到的唯一解決方案是使用to_csv
/read_csv
,但將類型信息保存在別的地方。不過,恐怕還有更多隱藏的問題(比如重複的列名等)。
@tzaman我想這是相關的,但問題是集中在速度和頂/接受的答案是完全不合適的在我的情況,因爲我在尋找的便攜性。 (pickle文件不能在Python之外讀取,不容易)。 – max
同樣的答案也提到'hdf5'。這不滿足嗎? – piRSquared
@piRSquared Yup剛剛檢查,它的工作原理。 (除了不允許同名的列,但沒關係)我沒有看到HDF5讀/寫的文檔是可逆的,但我想它恰好是.. – max