與分別安裝HBase和Hadoop一起安裝HBase + Hadoop有什麼優點和缺點？

我的意思是，2個選項： 1.在Hadoop集羣上安裝HBase，這也是離線計算，所以只能有1個hadoop集羣。 2.爲離線計算安裝Hadoop集羣，然後僅安裝另一個Hadoop集羣以使HBase使用其HDFS。與分別安裝HBase和Hadoop一起安裝HBase + Hadoop有什麼優點和缺點？

所以2個選項是：一個是集成的集羣，另一個實際上是2個集羣。

對於這2個選項，有什麼優點&？

選項1：集成集羣。

優點：讀取或寫入HBase的MapReduce將作爲數據局部性更高效。

缺點：HBase地區服務器會降低機器（Datanode和TaskTracker）的性能，因爲它需要容納一些CPU和內存。如果有很多MapReduce作業，HBase延遲可能是秒。因此，如果您希望及時製作HBase響應，則需要更多工作（例如，使用memcache來提高讀取性能）。

選項2：2個羣集。

Prons：HBase區域服務器不會影響HDFS日期節點和TaskTracker的性能。

缺點：如果MapReduce需要訪問HBase，需要遠程讀寫數據。該選件還需要更多的機器。

2013-07-11 01:41:29 zsxwing

回答