pytables

0熱度

1回答

我想存儲在PyTables HDF5表中的所有值都是實數，這使得在常規表格上選擇二維數組成爲合理的選擇。但是對於數組中的許多單元格，該值可能不可用（並且稍後可用），並且唯一合理簡單的方法表明該操作似乎將NaN分配給單元格（就我所知，您不能只將None）。我有創建表的方式如下： with tables.open_file(file_full_name, 'a') as file: tab

2熱度

1回答

HDF5 ImportError與PyTables for Windows

我已經安裝了HDF5.dll和HDF5dll.dll在我能想到的每個目錄中 - PYTHONPATH，USERPROFILE，在PyTables站點包文件夾中 - 我仍然返回以下錯誤： ImportError: Could not load any of ['hdf5.dll', 'hdf5dll.dll'], please ensure that it can be found in the s

0熱度

1回答

正在同步通過Dropbox的文件的HDF5，因爲它是被寫入

我有一個python腳本，看起來像這樣： #!/usr/bin/env python3 import tables as pt import numpy as np import time class TestTable(pt.IsDescription): timestamp = pt.Float64Col() voltage = pt.Float32Col()

1熱度

1回答

同時讀熊貓的一個HDF5文件

我有一個data.h5文件組織成多個塊，整個文件有幾百吉字節。我需要以Pandas DataFrame的形式在內存中處理文件的過濾子集。以下例程的目標是將篩選工作分佈到多個進程，然後將篩選結果連接到最終的DataFrame中。由於從文件讀取需要大量的時間，我試圖讓每個進程都以併發的方式讀取自己的塊。 import multiprocessing as mp, pandas as pd st

0熱度

1回答

python多處理（使用pytable）在最終輸出中錯過了隊列中的一些結果

在我陳述我的問題之前，讓我把我的約束 - 我不能發佈代碼，因爲它與我的工作有關，而且他們不允許它。所以這只是一個調查問卷，以查看是否有人看到類似的問題。我有一個python多處理設置在工作人員做的工作，並把結果放入隊列。一位特殊的作家工作者然後從隊列中累積結果。這些結果是簡單的熊貓系列。累加器將結果放入熊貓數據框並將其寫入磁盤上的pytable。問題是我隨機看到數據幀中有時會丟失一些結果，例如

0熱度

1回答

從Amazon S3和Boto3下載並讀取HDF5文件

我在這裏很新。我會盡力澄清。我已經用pytables創建了一個hdf5文件，我用數據填充了它。 s3_client.upload_file(local_file_key, aws_bucket_name, aws_file_key) 我從S3和商店下載同一個HDF5文件：然後，我從我的AWS集羣在/ tmp /目錄下使用此代碼上傳我的文件到一個S3桶它再次出現在我AWS集羣在/ tmp /目錄

0熱度

1回答

使用PyTables

我通常使用h5py做HDF5東西在Python和我是否想創建，我想以後擴展數據集，或者我做HDF5擴展陣列： f = h5py.File('foo.h5', 'w') d = f.create_dataset('whatever', (5, 5), maxshape=(None, 5), dtype='i8', chunks=True) ... d.resize((23, 5)) ...

1熱度

1回答

如何使用Dask在此「嵌套」結構化數組上運行計算？

我正在嘗試與dask開始。在下面的玩具示例中，我有三列，分別是site,counts和readings。 site和counts是標量列，而readings包含三維數組。我可以在counts上運行計算，但如果我嘗試在readings上運行它們，我會得到一個異常。我在這裏正確使用dask？ import dask.array as da import numpy as np import ta

0熱度

1回答

無法使用intelpython導入pytables

想知道是否有人用anaconda嘗試過IntelPython。我創建了一個環境，在URL鏈接 Intel Python 然而，當我嘗試導入pytables，我得到： - (intelpython) [email protected]:/opt/anaconda3/bin$ python Python 3.5.3 |Intel Corporation| (default, Apr 27 2017,

0熱度

1回答

如何使用PyTable迭代列名稱？

我有一個大的矩陣（15000行x 2500列）使用PyTables存儲並獲取如何遍歷行的列迭代。在documentation我只看到如何通過名稱手動訪問每行。我有這樣的列： ID X20160730_Day10_123a_2 X20160730_Day10_123b_1 X20160730_Day10_123b_2 ID列值是像 '10692.RFX7'，但所有其它的字符串單元格值是浮動。這種選