pytables

1熱度

1回答

運行TsTables example once：一切正常。運行第二次： tables.exceptions.NodeError：組/已有一個名爲BPI 有道理的子節點，不能做 ts = f.create_ts('/','BPI',BpiValues) 因爲對應的節點/葉已經存在在HDF5樹中。問題：應如何從已存在的組實例化TsTable類？在文件處理程序上執行.getNode('/', 'B

1熱度

1回答

使用分塊數據，同時需要groupby操作

我有一個數據集df，有三列：'String_key_val','Float_other_val1','Int_other_val2'。我想在key_val上groupby，然後提取關於這些組的val1（或val2）的總和。這裏是我的代碼： df = pandas.read_csv('test.csv') grouped = df.groupby('String_key_val') series

0熱度

1回答

存儲碎片（可變長度）的數組對象w/pytables

我會在開頭提到這個問題前注意到我很樂意考慮pytables的替代方法，但我更願意使用pytables來從numexpr特性中受益。我正在尋找一個解決方案來存儲/探索/分析我的數據，例如以下形式：假設我有許多Event對象，代表某個時刻的某些實驗測量。每個Event包含一些標量字段，以及一個變量數的Particle對象，其中每個對象都包含一些標量字段。見下面我的「繪圖」。我的第一個想法是將每個E

3熱度

2回答

TypeError：read_hdf（）只需要2個參數（1給出）

如何在鑰匙未知時用pandas.read_hdf打開HDF5文件？ from pandas.io.pytables import read_hdf read_hdf(path_or_buf, key) pandas.__version__ == '0.14.1' 這裏的關鍵參數是未知的。由於

1熱度

1回答

你怎麼讀pytables表成大熊貓數據幀

我建立了一個pytables表並填充它使用追加像這樣： h5file = open_file("FGBS.h5", mode = "a") group = h5file.create_group("/", 'hybrid') table = h5file.create_table(group, 'z4', Hybrid ,filters= tb.Filters(5, "blosc")) 使

1熱度

1回答

從HDFStore檢索多索引熊貓數據框時出現問題（表格格式）

我有一些代碼，簡化爲下面的示例，它包含一些原始數據，從中創建一個數據透視表，然後將它與另一個數據幀合併，最後將結果存儲在HDFStore對象中。如果以固定格式存儲，則可以很容易地找到它。但是，如果以表格格式存儲，則會產生錯誤。我需要表格格式，以便我可以一次提取塊（總數據集爲數千萬行）。任何想法是什麼問題？代碼示例： import pandas as pd def createFrame()

6熱度

1回答

如何在anaconda上安裝pytables 3.2？

我使用Anaconda，並與 conda update pytables 它說：「已安裝」我不能升級。 .... # All requested packages already installed. # packages in environment at C:\Anaconda: # pytables 3.1.1 np19py27_1 然後我試圖PIP： C:\U

1熱度

2回答

需要pytables的快速日期轉換器

我必須將很多csv數據轉換爲pytable。如果我只是將日期存儲爲字符串，我可以在5個小時內完成這項工作。但是，這對於查詢操作沒什麼用處，所以我希望它是一個整數，或者使搜索更快的某種格式。這是我曾嘗試： np.datetime64(date) 這是快，但pytables不會直接存儲，因爲我與「M8」不被接受numpy的陣列結構和類型寫。使用astype轉換爲int64會顯着降低進程速度。

0熱度

1回答

查詢字詞無效[[條件：[無]]]

我似乎無法能夠查詢最簡單的數據幀在HDFStore： In [1]: import pandas as pd pd.__version__ Out[1]: '0.15.1' In [2]: df = pd.DataFrame.from_dict({'A':[1,2],'B':[100,200], 'C':[42,11]}) df_a = df.set_index('A') df

0熱度

1回答

如何初始化PyTables表列的大小？

我正在做蒙特卡洛計算，我想將中間結果保存到磁盤。以下是我的代碼的基本版本。在我的原始版本中，我有一個數據聚合器對象，它可以收集每個軌跡的結果，然後計算一些統計數據並寫入磁盤，但是我開始耗盡內存，而且這些文件很笨重。我試圖改用PyTables，以便我可以a）將數據刷新到磁盤，並b）有效地將其讀回，以便在完成後進一步處理。我正在從this tutorial工作。我的問題是，對於每次運行，將進入laye