1
我的意思是,2個選項: 1.在Hadoop集羣上安裝HBase,這也是離線計算,所以只能有1個hadoop集羣。 2.爲離線計算安裝Hadoop集羣,然後僅安裝另一個Hadoop集羣以使HBase使用其HDFS。與分別安裝HBase和Hadoop一起安裝HBase + Hadoop有什麼優點和缺點?
所以2個選項是:一個是集成的集羣,另一個實際上是2個集羣。
對於這2個選項,有什麼優點&?
我的意思是,2個選項: 1.在Hadoop集羣上安裝HBase,這也是離線計算,所以只能有1個hadoop集羣。 2.爲離線計算安裝Hadoop集羣,然後僅安裝另一個Hadoop集羣以使HBase使用其HDFS。與分別安裝HBase和Hadoop一起安裝HBase + Hadoop有什麼優點和缺點?
所以2個選項是:一個是集成的集羣,另一個實際上是2個集羣。
對於這2個選項,有什麼優點&?
選項1:集成集羣。
優點:讀取或寫入HBase的MapReduce將作爲數據局部性更高效。
缺點:HBase地區服務器會降低機器(Datanode和TaskTracker)的性能,因爲它需要容納一些CPU和內存。如果有很多MapReduce作業,HBase延遲可能是秒。因此,如果您希望及時製作HBase響應,則需要更多工作(例如,使用memcache來提高讀取性能)。
選項2:2個羣集。
Prons:HBase區域服務器不會影響HDFS日期節點和TaskTracker的性能。
缺點:如果MapReduce需要訪問HBase,需要遠程讀寫數據。該選件還需要更多的機器。