pytables

    0熱度

    1回答

    我想存儲在PyTables HDF5表中的所有值都是實數,這使得在常規表格上選擇二維數組成爲合理的選擇。但是對於數組中的許多單元格,該值可能不可用(並且稍後可用),並且唯一合理簡單的方法表明該操作似乎將NaN分配給單元格(就我所知,您不能只將None)。 我有創建表的方式如下: with tables.open_file(file_full_name, 'a') as file: tab

    2熱度

    1回答

    我已經安裝了HDF5.dll和HDF5dll.dll在我能想到的每個目錄中 - PYTHONPATH,USERPROFILE,在PyTables站點包文件夾中 - 我仍然返回以下錯誤: ImportError: Could not load any of ['hdf5.dll', 'hdf5dll.dll'], please ensure that it can be found in the s

    0熱度

    1回答

    我有一個python腳本,看起來像這樣: #!/usr/bin/env python3 import tables as pt import numpy as np import time class TestTable(pt.IsDescription): timestamp = pt.Float64Col() voltage = pt.Float32Col()

    1熱度

    1回答

    我有一個data.h5文件組織成多個塊,整個文件有幾百吉字節。我需要以Pandas DataFrame的形式在內存中處理文件的過濾子集。 以下例程的目標是將篩選工作分佈到多個進程,然後將篩選結果連接到最終的DataFrame中。 由於從文件讀取需要大量的時間,我試圖讓每個進程都以併發的方式讀取自己的塊。 import multiprocessing as mp, pandas as pd st

    0熱度

    1回答

    在我陳述我的問題之前,讓我把我的約束 - 我不能發佈代碼,因爲它與我的工作有關,而且他們不允許它。所以這只是一個調查問卷,以查看是否有人看到類似的問題。 我有一個python多處理設置在工作人員做的工作,並把結果放入隊列。一位特殊的作家工作者然後從隊列中累積結果。這些結果是簡單的熊貓系列。累加器將結果放入熊貓數據框並將其寫入磁盤上的pytable。 問題是我隨機看到數據幀中有時會丟失一些結果,例如

    0熱度

    1回答

    我在這裏很新。我會盡力澄清。 我已經用pytables創建了一個hdf5文件,我用數據填充了它。 s3_client.upload_file(local_file_key, aws_bucket_name, aws_file_key) 我從S3和商店下載同一個HDF5文件: 然後,我從我的AWS集羣在/ tmp /目錄下使用此代碼上傳我的文件到一個S3桶它再次出現在我AWS集羣在/ tmp /目錄

    0熱度

    1回答

    我通常使用h5py做HDF5東西在Python和我是否想創建,我想以後擴展數據集,或者我做HDF5擴展陣列: f = h5py.File('foo.h5', 'w') d = f.create_dataset('whatever', (5, 5), maxshape=(None, 5), dtype='i8', chunks=True) ... d.resize((23, 5)) ...

    1熱度

    1回答

    我正在嘗試與dask開始。在下面的玩具示例中,我有三列,分別是site,counts和readings。 site和counts是標量列,而readings包含三維數組。 我可以在counts上運行計算,但如果我嘗試在readings上運行它們,我會得到一個異常。我在這裏正確使用dask? import dask.array as da import numpy as np import ta

    0熱度

    1回答

    想知道是否有人用anaconda嘗試過IntelPython。我創建了一個環境,在URL鏈接 Intel Python 然而,當我嘗試導入pytables,我得到: - (intelpython) [email protected]:/opt/anaconda3/bin$ python Python 3.5.3 |Intel Corporation| (default, Apr 27 2017,

    0熱度

    1回答

    我有一個大的矩陣(15000行x 2500列)使用PyTables存儲並獲取如何遍歷行的列迭代。在documentation我只看到如何通過名稱手動訪問每行。 我有這樣的列: ID X20160730_Day10_123a_2 X20160730_Day10_123b_1 X20160730_Day10_123b_2 ID列值是像 '10692.RFX7',但所有其它的字符串單元格值是浮動。這種選