我面臨着同樣的問題,因爲一個在How to trouble-shoot HDFStore Exception: cannot find the correct atom type提高。 我將其降低到熊貓文檔Storing Mixed Types in a Table中給出一個例子。 本示例中的全部內容是append a DataFrame,其中一些缺失值爲HDFStore。當我使用示例代碼時,我最
我想從大約1 GB的HDFStore表中選擇隨機行。當我詢問大約50個隨機行時,RAM使用情況爆發。 我正在使用熊貓0-11-dev, python 2.7, linux64。 在第一種情況下的內存使用適合的chunk with pd.get_store("train.h5",'r') as train:
for chunk in train.select('train',chunksize=5