2013-08-27 49 views

回答

11

MRv1使用JobTracker創建任務並將其分配給數據節點,當集羣擴展足夠遠時(通常約有4000個節點),這可能會成爲資源瓶頸。 MRV2(又名YARN,「另一個資源談判器」)爲每個集羣都有一個資源管理器,每個數據節點運行一個節點管理器。對於每個作業,一個從節點將作爲應用萬事達,監控資源/任務等

+1

Cloudera有一個[視頻,提供了一個視覺解釋來支持這裏](http://university.cloudera.com/certification/prep/ccdh.html)...'(16:06到視頻通過22 :15)' –

+0

鏈接已損壞 – vumaasha

3

MRv1其也稱爲Hadoop的1其中HDFS(資源管理和調度)和MapReduce(編程框架)緊密耦合。 由於這種非批處理應用程序無法在hadoop 1上運行。 它具有單個namenode,因此它不提供高系統可用性和可伸縮性。

MRv2(又名的Hadoop 2)在這個版本的hadoop的資源管理和調度任務從的MapReduce其通過YARN(然而,另一個資源談判)分離分離。 資源管理和調度層位於MapReduce層下面。 它還提供高系統可用性和可擴展性,因爲我們可以創建冗餘的NameNode。 快照的新功能,通過它我們可以備份有助於災難恢復的文件系統。