pytables

    1熱度

    1回答

    可以說有人給我一個隨機的HDF5文件。我想編寫一個函數來檢查使用的組/「鍵」是什麼。 以熊貓HDFStore()。對於許多檢索HDF5數據的方法,需要知道密鑰,例如, pandas.HDFStore.get() http://pandas.pydata.org/pandas-docs/stable/generated/pandas.HDFStore.get.html 什麼是檢查密鑰的身份,如果不是

    2熱度

    2回答

    我有一些時間序列數據,我以前使用pytables存儲爲hdf5文件。我最近嘗試與h5py庫存儲相同。但是,由於numpy數組的所有元素都必須具有相同的dtype,因此在使用h5py庫進行存儲之前,必須將日期(通常是索引)轉換爲'float64'類型。 當我使用pytables時,索引及其dtype被保留下來,這使得我可以查詢時間序列而不需要將它全部放入內存中。我想用h5py這是不可能的。我在這裏錯

    0熱度

    1回答

    我在修改pytables文件時遇到問題。 我想加載文件並從中刪除原始圖像。因爲我可以發現從pytables中刪除數據 - 文件並不太容易。我只找到了「.remove_node()」方法。但是,當我以寫入模式打開文件時,它會被新的/空的pytables文件覆蓋。當我以讀模式打開它時,我無法明顯更改文件。 我在這裏做錯了什麼?該方法應該如何使用?我必須打開一個新文件並複製數據嗎?

    0熱度

    2回答

    我想將列表附加到h5中的表格中。當直接追加數據時,就完成了; ts=[(datetime.date(2017, 5, 30), 233, 856, 0.2355, 1.17692), (datetime.date(2017, 5, 30), 192, 518, 1.27893, -0.60389)] tab2.append(rows=ts) 而從源追加數據, tab2.append(rows=ta

    0熱度

    1回答

    我使用的一些代碼創建的矩陣大於RAM。我的第一個想法是通過修改當前的矩陣來使用pytables來使用pytables。但是編碼會很痛苦(我使用的代碼是開源的,通過跟蹤矩陣的每一次使用和其他相關的編碼原因,進行修改是一個真正的痛苦)。但是做了一些小小的研究,我發現那些說python實際上使用虛擬內存的材料。所以如果我有一個非常大的虛擬內存,比如1TB,那麼我的程序就不用擔心會出現「內存不足錯誤」。順

    1熱度

    1回答

    我遵循這裏的安裝準則。 http://www.pytables.org/usersguide/installation.html 因此,無論何時我從PyTables/build/lib.linux-x86_64-2.7文件夾在iPython中運行此命令,它都可以正常工作。 In [1]: import pandas as pd In [2]: store = pd.HDFStore('store.

    0熱度

    1回答

    我使用PyTables,我想檢查一個表是否已經創建,如果沒有,然後創建它。 我使用下面的代碼: if handle.__contains__(handle.root.grades)==False: handle.create_table('/', 'grades', grades) 而當有一個名爲「等級」,該程序報錯沒有這樣的表:「NoSuchNodeError:組/沒有名爲孩子gr

    4熱度

    2回答

    您可以將數據存儲爲大熊貓HDFStore並打開它們並使用pytables執行i/o?這個問題出現的原因是因爲我目前存儲數據 pd.HDFStore('Filename',mode='a') store.append(data) 但是,據我瞭解大熊貓不支持更新記錄這麼多。我有一個用例,我必須每天更新5%的數據。 pd.io.pytables會工作嗎?如果是這樣,我沒有發現這方面的文件? Pyt

    1熱度

    2回答

    我正在構建模擬軟件,並且需要在HDF5文件的表中寫入(數千個)2D numpy陣列,其中陣列的一個維度是可變的。傳入array是float32類型;爲了節省磁盤空間,每個數組都以表格的形式存儲,併爲列提供適當的數據類型(因此不使用數組)。當我讀表時,我想檢索一個float32類型的numpy.ndarray,所以我可以爲分析做很好的計算。下面是帶有物種A,B和C加上時間的陣列的示例代碼。 我目前正

    0熱度

    1回答

    在下面的例子,我試圖存儲多指標pandas.DataFrame在h5文件格式 import pandas as pd import numpy as np store = pd.HDFStore('c:/temp/example.h5') idx = pd.MultiIndex.from_arrays([['first']*3,['one','two','three']], names =