2012-12-23 216 views
1

我需要在我的cloudera CDH4羣集設置上運行簡單的基準測試。 我的cloudera羣集設置(CDH4)有4個節點,A,B,C和D 我正在使用cloudera manager FREE版本來管理cloudera服務。 每個節點都配置爲執行多個角色,如下所述。 答:NameNode的,JobTrackerNode,RegionServer的,SecondaryNameNode,數據管理部,TaskTrackerNode B:數據管理部,TaskTrackerNode C:數據管理部,TaskTrackerNode d:數據管理部,TaskTrackerNodecloudera羣集節點角色

第一個問題是,一個節點可以被NameNode和數據管理部? 這個設置是否正確? 我的第二個問題是,在cloudera經理UI上,我可以看到許多服務正在運行,但我不確定我是否需要所有這些服務? 服務於我的設置運行是: hbase1 hdfs1 mapreduce1 hue1 oozie1 zookeeper1

我是否只需要hdfs1和mapreduce1服務。如果是,我如何刪除其他服務?

Cloud和hadoop概念對我來說是新生事物,所以如果我的一些假設是不合邏輯的或錯誤的,那麼請原諒我。

回答

3

對你的第一個問題的回答是肯定的。但由於NameNode需要足夠的RAM,因此在生產中永遠不會這樣做。人們通常只在其主節點上運行NameNode + JobTracker。在另一臺機器上運行SecondarNameNode也更好。

來到您的第二個問題,Cloudera Manager不僅僅是Hadoop。它是一個完整的軟件包,包含了HBase(一個NOSQL DB),Oozie(一個工作流引擎)等幾個Hadoop子項目,這些都是您在UI上看到的過程。

如果你想玩Hadoop,HDFS和MapReduce就足夠了。您可以從UI本身輕鬆停止其他進程。它不會對您的Hadoop集羣造成任何損害。

HTH