2013-10-29 124 views
0

您好我有一個小疑問,我已經開始在我的好奇心使用,但現在我有以下問題 我的情況是這樣的 - 我有10臺機器連接在局域網中,我需要創建名稱節點在一個系統中,數據節點在其餘9臺機器中。所以我需要在所有10臺機器上安裝Hadoop嗎?的Hadoop集羣配置/安裝

例如我有(1 .. 10)的機器,其中MACHINE1是服務器和從機(2..9)是從站[數據節點]所以我需要在所有10臺機器安裝hadoop的?

,我已經搜查了很多的Hadoop集羣網絡商品計算機上,但我不力獲得有關安裝任何東西[即配置。他們中有些人想怎麼配置和自己的系統上安裝Hadoop的,但不是在集羣環境中

任何一個可以幫助我了?並給我詳細的想法或文章建議鏈接做上述過程

感謝

回答

2

是,您需要安裝在每個節點的Hadoop和每個節點應該有服務開始作爲適合於它的作用。另外,每個節點上的配置文件必須連貫地描述羣集的拓撲,包括各種常用資源(例如namenode)的位置/名稱/端口。從頭開始手動執行此操作很容易出錯,特別是如果您以前從未這樣做過,並且您不確切知道您要做什麼。也可以決定Hadoop的具體分佈(HortonWorks,Cloudera,HDInsight,Intel等)

我會推薦使用其中的一種部署解決方案。我最喜歡的是Puppet,但我確定Chef也會。

不同的(也許是更好?)替代方案是使用Ambari,這是一個專業的Hadoop部署和管理的解決方案。請參閱Deploying and Managing Hadoop Clusters with AMBARI

一些木偶資源,讓你開始:Using Vagrant, Puppet, Testing & Hadoop

1
  1. 是Hadoop的需要存在於所有的計算機
  2. 對於羣集環境,請經過video