我試圖覆蓋hdf5文件中的熊貓數據幀。每次我這樣做時,文件大小都會增長,而存儲的幀內容相同。如果我使用mode ='w',那麼我失去了所有其他記錄。 這是一個錯誤還是我錯過了什麼? import pandas
df = pandas.read_csv('1.csv')
for i in range(100):
store = pandas.HDFStore('tmp.h5')
我有一個HDF5文件,其中包含一個非常大的EARRAY,我想截斷它以節省磁盤空間並更快地處理它。我在包含EARRAY的節點上使用truncate方法。 pytables報告數組已被截斷,但仍佔用磁盤上相同的空間。 目錄列表截斷前: $ ll total 3694208
-rw-rw-r-- 1 chris 189 Aug 27 13:03 main.py
-rw-rw-r-- 1 chris
我有一個包含pandas Series/DataFrame表的HDF5文件。我需要在HDF一鍵下存儲的表格(熊貓)指數,但不一定是整個表: 我能想到兩個(實際上是相同的)獲得該指數的方法: import pandas as pd
hdfPath = 'c:/example.h5'
hdfKey = 'dfkey'
# way 1:
with pd.HDFStore(hdfPath) as