我很好奇你是否可以將HDFS文件系統從MapReduce框架中分離出來。我知道Hadoop的主要目的是運行映射並減少有問題的數據在機器上,但我想知道是否可以更改* .xml文件來更改jobtracker,namenode和datanodes正在運行。如何將Hadoop MapReduce與HDFS分開?
目前,我的配置是2個虛擬機的設置:一個(主)與Namenode,Datanode,JobTracker,Tasktracker(和SecondaryNameNode),另一個(從屬)DataNode,Tasktraker。從本質上講,我想要改變的是擁有NameNode DataNode(s)的Job Master,JobTracker,並且只有TaskTracker的從機執行計算(後來,只有TaskTracker有更多的奴隸;每個都有一個) 。瓶頸將是兩臺虛擬機之間爲了計算地圖和減少數據而進行的數據傳輸,但由於這個階段的數據非常小,我不主要關心它。我只想知道這個配置是否可行,以及如何去做。有小費嗎?
謝謝!
這可能會起作用,但是爲了停止羣集,必須再次更改主/從文件。 – 2012-07-07 03:05:04
這似乎現在爲我的目的工作!謝謝! – 2012-07-16 19:06:08