使用Matlab,我將生成幾個數據文件並將它們以H5格式存儲爲20x1500xN
,其中N是一個可以變化的整數,但通常在2300左右。每個文件將有4個具有相同結構的不同數據集。因此,我將很快實現存儲問題。我的兩個問題:在Matlab中使用HDF5/H5優化壓縮
有什麼理由不分割的4個不同的數據集,並只保存爲
4x20x1500xN
呢?我寧願讓它們分裂,因爲它是不同的信號形式,但是如果有任何計算/壓縮優勢而不讓它們分離,我會加入它們。使用Matlab的內置壓縮,我設置了
deflate=9
(和DataType=single
)。不過,我現在已經意識到使用deflate
會將我的計算時間與5相乘。我意識到這可能與我的ChunkSize
有關,我只是將它放在20x1500x5
之後 - 沒有任何推理。有沒有一種戰略方法來優化計算負荷w.r.t.通縮和壓縮時間?
謝謝。
比較你用'save('example.mat','yourdata',' - v7.3')'得到的性能和文件大小。它寫了一個gip壓縮HDF5,根據我的經驗,在速度和壓縮之間有一個很好的折中。意識到我直接停止使用hdf5庫。 – Daniel
@Daniel事情是我要用parfor循環寫入這個文件,這就是我選擇使用H5的原因。 –
沒有理由不使用保存在上下文中:http://www.mathworks.com/matlabcentral/answers/135285-how-do-i-use-save-with-a-parfor-loop-using-parallel -computing-toolbox – Daniel