我試圖通過在創建表格時指定chunkshape
來提高我的pytables/HDF5代碼的性能。我無法弄清楚chunkshape
參數的真實尺寸或格式。我可以從代碼中看到,它最終會以單個元素的形式出現。優化pytables/HDF5的chunkshape參數以讀取整列
這個單個元素應該是行數,字節數還是什麼?
我的具體問題是我有現有的代碼,創建一個20列的HDF5表。我想更改表的塊,以便每個列連續存儲在磁盤上。因此,一次優化讀取整個列。
我試着將chunkshape設置爲20(列數),但這大大降低了讀取整列的性能。應該將塊形狀設置爲單行的寬度(以字節爲單位)?
我只是想知道chunkshape應該是什麼,如果:
- 我想盡可能快地閱讀一整列。
- 我知道表中有多少列。
- 我不能只是簡單地將表更改爲具有現有行作爲列,反之亦然,出於向後兼容性的原因。
我強烈建議你問這個問題到PyTables郵件列表。你可以在那裏得到非常好的支持。 – Vicent