pytables

    1熱度

    1回答

    運行TsTables example once:一切正常。運行第二次: tables.exceptions.NodeError:組/已有一個名爲BPI 有道理的子節點,不能做 ts = f.create_ts('/','BPI',BpiValues) 因爲對應的節點/葉已經存在在HDF5樹中。 問題:應如何從已存在的組實例化TsTable類?在文件處理程序上執行.getNode('/', 'B

    1熱度

    1回答

    我有一個數據集df,有三列:'String_key_val','Float_other_val1','Int_other_val2'。我想在key_val上groupby,然後提取關於這些組的val1(或val2)的總和。這裏是我的代碼: df = pandas.read_csv('test.csv') grouped = df.groupby('String_key_val') series

    0熱度

    1回答

    我會在開頭提到這個問題前注意到我很樂意考慮pytables的替代方法,但我更願意使用pytables來從numexpr特性中受益。 我正在尋找一個解決方案來存儲/探索/分析我的數據,例如以下形式:假設我有許多Event對象,代表某個時刻的某些實驗測量。每個Event包含一些標量字段,以及一個變量數的Particle對象,其中每個對象都包含一些標量字段。見下面我的「繪圖」。 我的第一個想法是將每個E

    3熱度

    2回答

    如何在鑰匙未知時用pandas.read_hdf打開HDF5文件? from pandas.io.pytables import read_hdf read_hdf(path_or_buf, key) pandas.__version__ == '0.14.1' 這裏的關鍵參數是未知的。由於

    1熱度

    1回答

    我建立了一個pytables表並填充它使用追加像這樣: h5file = open_file("FGBS.h5", mode = "a") group = h5file.create_group("/", 'hybrid') table = h5file.create_table(group, 'z4', Hybrid ,filters= tb.Filters(5, "blosc")) 使

    1熱度

    1回答

    我有一些代碼,簡化爲下面的示例,它包含一些原始數據,從中創建一個數據透視表,然後將它與另一個數據幀合併,最後將結果存儲在HDFStore對象中。如果以固定格式存儲,則可以很容易地找到它。但是,如果以表格格式存儲,則會產生錯誤。我需要表格格式,以便我可以一次提取塊(總數據集爲數千萬行)。 任何想法是什麼問題? 代碼示例: import pandas as pd def createFrame()

    6熱度

    1回答

    我使用Anaconda,並與 conda update pytables 它說:「已安裝」我不能升級。 .... # All requested packages already installed. # packages in environment at C:\Anaconda: # pytables 3.1.1 np19py27_1 然後我試圖PIP: C:\U

    1熱度

    2回答

    我必須將很多csv數據轉換爲pytable。如果我只是將日期存儲爲字符串,我可以在5個小時內完成這項工作。但是,這對於查詢操作沒什麼用處,所以我希望它是一個整數,或者使搜索更快的某種格式。 這是我曾嘗試: np.datetime64(date) 這是快,但pytables不會直接存儲,因爲我與「M8」不被接受numpy的陣列結構和類型寫。 使用astype轉換爲int64會顯着降低進程速度。

    0熱度

    1回答

    我似乎無法能夠查詢最簡單的數據幀在HDFStore: In [1]: import pandas as pd pd.__version__ Out[1]: '0.15.1' In [2]: df = pd.DataFrame.from_dict({'A':[1,2],'B':[100,200], 'C':[42,11]}) df_a = df.set_index('A') df

    0熱度

    1回答

    我正在做蒙特卡洛計算,我想將中間結果保存到磁盤。以下是我的代碼的基本版本。在我的原始版本中,我有一個數據聚合器對象,它可以收集每個軌跡的結果,然後計算一些統計數據並寫入磁盤,但是我開始耗盡內存,而且這些文件很笨重。我試圖改用PyTables,以便我可以a)將數據刷新到磁盤,並b)有效地將其讀回,以便在完成後進一步處理。我正在從this tutorial工作。我的問題是,對於每次運行,將進入laye