2012-02-29 49 views
0

我有一個複製因子爲3的HBase集羣。我試圖提高讀取性能,以便可以獲得更多的「每秒獲取」。HBase和縮放讀取

當我在bench標記爲Gets(讀取)時,我使用一個htable池建立了與HBase的連接並連接到一個表。然後我以更快的間隔反覆讀取同一行並監視集羣負載。羣集中的所有節點都具有相同的硬件。我注意到,當單個節點上的CPU負載增加時。鑑於我已經配置了複製因子爲3的羣集,我會假設讀取將在任何數據副本上執行,而不是單個節點上的單個副本上(我期望看到負載增加3服務器,而不只是一個)。

如何提高讀取性能,使我的Get查詢在3個複製數據集之間更好地平衡,而不是從單個節點讀取。

由於

回答

1

的3所述的複製因數意味着底層HDFS塊被重複3次,但每個區域的HBase由單個HRegionServer提供服務,所以一行只能從一個位置進行服務。

+0

這是我的恐懼。感謝您的澄清。 – Tucker 2012-03-08 16:41:18