2009-07-24 47 views
5

我們正在評估HDF5關於分塊數據集的性能。 特別是我們試圖找出是否有可能讀取不同的連續塊,以及這樣做會影響性能? 例如我們有一個塊大小爲10的數據集,一個包含100個值的數據集並且想要讀取23到48的值。是否會有很大的性能損失?Chunked HDF5數據集和slabsize

非常感謝!

回答

3

我不知道如何具體回答你的問題,但我建議你使用1024的塊大小(或任何兩個更高的功率)。我不知道HDF5的內部結構,但是從我對文件系統的瞭解以及我們做的粗略的基準測試中,1024是正確的。

+0

非常感謝您的回答!我已經觀察到,塊大小本身是一個重要的性能因素。正如你所提到的,大於1000的塊是一個很好的起點。我試圖弄清楚的是,當從不同塊中讀取連續數據時,性能如何受到影響。但是,我擔心這是一個無法具體回答的問題。所以我們將不得不執行幾個基準。 – usac 2009-07-27 08:31:57