2014-07-18 150 views
1

我最近讀到Hbase主要壓縮後,如果存儲文件的大小變得大於hbase.hregion.max.filesize,即256MB,那麼它又會溢出到2.所以任何人都可以解釋壓縮是在什麼尺寸的文件上完成的。 重大壓縮後形成的商店文件將包含多少列家族的數據?什麼是hbase壓縮文件大小

回答

2

hbase.hregion.max.filesize指顧名思義 - 區域大小。區域基本上是您的hbase數據的分區(存儲爲hfiles)。 HBase會將您的數據存儲到區域中,並且如果某個區域變得太大(太大則由hbase.hregion.max.filesize定義),將split區域劃分爲兩個區域。

通常,256MB的區域大小非常小,大多數用例需要更大的區域。確定確切的大小可以是一個黑暗的藝術,但這裏是參考:http://hbase.apache.org/book/ops.capacity.html#ops.capacity.regions

當你在htable描述

每個地區創建一個表應該有所有你的表中定義的列族可以設置區域大小。爲了進一步調整性能,您可以指定每列系列的塊大小,並且可以通過掃描,獲取和寫入來影響性能。

您也可以看看這個資源的配置技巧: http://hbase.apache.org/book/important_configurations.html

+0

我感到困惑的壓實過程。壓縮文件的大小是多少? – XYZ