pytables

1熱度

1回答

可以說有人給我一個隨機的HDF5文件。我想編寫一個函數來檢查使用的組/「鍵」是什麼。以熊貓HDFStore()。對於許多檢索HDF5數據的方法，需要知道密鑰，例如， pandas.HDFStore.get() http://pandas.pydata.org/pandas-docs/stable/generated/pandas.HDFStore.get.html 什麼是檢查密鑰的身份，如果不是

2熱度

2回答

我應該如何使用h5py lib來存儲時間序列數據

我有一些時間序列數據，我以前使用pytables存儲爲hdf5文件。我最近嘗試與h5py庫存儲相同。但是，由於numpy數組的所有元素都必須具有相同的dtype，因此在使用h5py庫進行存儲之前，必須將日期（通常是索引）轉換爲'float64'類型。當我使用pytables時，索引及其dtype被保留下來，這使得我可以查詢時間序列而不需要將它全部放入內存中。我想用h5py這是不可能的。我在這裏錯

0熱度

1回答

pytables：如何從重新打開的文件中刪除數據

我在修改pytables文件時遇到問題。我想加載文件並從中刪除原始圖像。因爲我可以發現從pytables中刪除數據 - 文件並不太容易。我只找到了「.remove_node（）」方法。但是，當我以寫入模式打開文件時，它會被新的/空的pytables文件覆蓋。當我以讀模式打開它時，我無法明顯更改文件。我在這裏做錯了什麼？該方法應該如何使用？我必須打開一個新文件並複製數據嗎？

0熱度

2回答

字段數量和陣列數量之間的不匹配

我想將列表附加到h5中的表格中。當直接追加數據時，就完成了; ts=[(datetime.date(2017, 5, 30), 233, 856, 0.2355, 1.17692), (datetime.date(2017, 5, 30), 192, 518, 1.27893, -0.60389)] tab2.append(rows=ts) 而從源追加數據， tab2.append(rows=ta

0熱度

1回答

Pytables vs虛擬內存

我使用的一些代碼創建的矩陣大於RAM。我的第一個想法是通過修改當前的矩陣來使用pytables來使用pytables。但是編碼會很痛苦（我使用的代碼是開源的，通過跟蹤矩陣的每一次使用和其他相關的編碼原因，進行修改是一個真正的痛苦）。但是做了一些小小的研究，我發現那些說python實際上使用虛擬內存的材料。所以如果我有一個非常大的虛擬內存，比如1TB，那麼我的程序就不用擔心會出現「內存不足錯誤」。順

1熱度

1回答

ImportError：HDFStore需要PyTables，「沒有模塊命名錶」

我遵循這裏的安裝準則。 http://www.pytables.org/usersguide/installation.html 因此，無論何時我從PyTables/build/lib.linux-x86_64-2.7文件夾在iPython中運行此命令，它都可以正常工作。 In [1]: import pandas as pd In [2]: store = pd.HDFStore('store.

0熱度

1回答

NoSuchNodeError當確定文件中的表

我使用PyTables，我想檢查一個表是否已經創建，如果沒有，然後創建它。我使用下面的代碼： if handle.__contains__(handle.root.grades)==False: handle.create_table('/', 'grades', grades) 而當有一個名爲「等級」，該程序報錯沒有這樣的表：「NoSuchNodeError：組/沒有名爲孩子gr

4熱度

2回答

存儲爲熊貓數據框並更新爲Pytables

您可以將數據存儲爲大熊貓HDFStore並打開它們並使用pytables執行i/o？這個問題出現的原因是因爲我目前存儲數據 pd.HDFStore('Filename',mode='a') store.append(data) 但是，據我瞭解大熊貓不支持更新記錄這麼多。我有一個用例，我必須每天更新5％的數據。 pd.io.pytables會工作嗎？如果是這樣，我沒有發現這方面的文件？ Pyt

1熱度

2回答

讀寫HDF5文件中的numpy陣列

我正在構建模擬軟件，並且需要在HDF5文件的表中寫入（數千個）2D numpy陣列，其中陣列的一個維度是可變的。傳入array是float32類型;爲了節省磁盤空間，每個數組都以表格的形式存儲，併爲列提供適當的數據類型（因此不使用數組）。當我讀表時，我想檢索一個float32類型的numpy.ndarray，所以我可以爲分析做很好的計算。下面是帶有物種A，B和C加上時間的陣列的示例代碼。我目前正

0熱度

1回答

寫大熊貓據幀到HDF5使用pytables模塊

在下面的例子，我試圖存儲多指標pandas.DataFrame在h5文件格式 import pandas as pd import numpy as np store = pd.HDFStore('c:/temp/example.h5') idx = pd.MultiIndex.from_arrays([['first']*3,['one','two','three']], names =