2016-08-12 21 views
1

我想將熊貓表保存在一個文件中,以便以後可以從該文件讀取它。我的要求:格式以便乾淨地保存和恢復DataFrame?

  • 文件格式應該是體面便攜式(Windows/Linux上好的庫支持主要語言)

  • 我看應該是絕對等同於一個我救

  • 數據幀

this postread_csvto_csv可以工作,如果我提供index_col=0的說法,但數據類型失去了(當然,自動類型推斷並不瓜拉ntee給我相同的類型even for simple types,更不用說如果我使用像從未推斷的list這樣的python對象)。

是否有一些簡單的解決方案可以正常工作,而不必擔心很多邊緣情況?

我能想到的唯一解決方案是使用to_csv/read_csv,但將類型信息保存在別的地方。不過,恐怕還有更多隱藏的問題(比如重複的列名等)。

+0

@tzaman我想這是相關的,但問題是集中在速度和頂/接受的答案是完全不合適的在我的情況,因爲我在尋找的便攜性。 (pickle文件不能在Python之外讀取,不容易)。 – max

+1

同樣的答案也提到'hdf5'。這不滿足嗎? – piRSquared

+0

@piRSquared Yup剛剛檢查,它的工作原理。 (除了不允許同名的列,但沒關係)我沒有看到HDF5讀/寫的文檔是可逆的,但我想它恰好是.. – max

回答

-1

pd.DataFrame.to_pickle/pd.read_pickle保存列數據類型。讓我們來看看:

df_in.to_pickle('input_5') 
df_out = pd.read_pickle('/input_5')