2017-07-18 25 views
4

我已經從Julia的dataframe模塊創建了一些JLD文件,現在我想將它們導入到Pandas數據框中。在Julia中閱讀和編寫這些文件非常容易,但我還沒有在Python3中找到簡單的方法。我檢查過jld文件的內容,它非常複雜,所以必須有一個可以讀入數據框,保留列類型和名稱等的包。有一個Python的JLD包,但似乎是對於Python2並且在8年內還沒有更新,所以我想知道Python的當前藝術狀態是如何讀取JLD文件的。Python3:讀取Julia的JLD格式

以下是我發現:

https://pypi.python.org/pypi/jld/0.0.39

+2

爲什麼不將其保存爲HDF5? JLD就像HDF5,但我不知道其他人是否可以閱讀它。 –

回答

2

如何將數據寫入幀出使用Feather.jl

import Feather 

Feather.write("my_data_frame.feather", my_df) 

及讀取到的大熊貓與

import pandas 

my_df = pandas.read_feather("my_data_frame.feather") 
+0

謝謝,今天會試一試。 –

+0

到目前爲止好。我喜歡這些線路解決方案。我以爲我會用JLD來解決這個問題,但由於某種原因,python3的python JLD支持從未實現。 –

2

Julia的.jld是HDF5的「方言」,即真正設計成用於讀取和寫入朱莉婭 - 作爲本身它允許你存儲類型 - 相關信息。如果你想使用跨語言的任何東西,只需使用普通的HDF5(這裏有一個julia包)。 - https://github.com/JuliaIO/HDF5.jl

注意:可能還需要一些工作來將您的julia數據幀保存爲可輕鬆加載到熊貓中的格式。有些問題請參閱Pandas can't read hdf5 file created with h5py