2013-05-22 106 views
5

Can有人可以解釋一下hadoop中Edge節點的體系結構。我只能在互聯網上找到定義。我有一些疑問要求有關集羣中邊緣節點的詳細信息

1)是否邊緣節點集羣的一部分(什麼好處,我們有,如果它是集羣內,這是否存儲任何數據塊HDFS。

2)該不該邊緣節點在羣集外。

3)請參閱我可以知道它的任何文檔。

回答

4

Edgenodes不是一個常見的Hadoop術語。我希望你找到了我應該回答你的問題的相同定義......這是戴爾的。

EdgeNode - EdgeNode是需要使用Hadoop環境的外部應用程序,工具和用戶的接入點。 EdgeNode位於Hadoop集羣和企業網絡之間,爲Hadoop環境提供訪問控制,策略實施,日誌記錄和網關服務。典型的 Hadoop環境至少有一個EdgeNode,根據性能需求更多。


所以這是真的取決於你。 Edgenode可能在羣集中,或者可能不在。它可能運行Hadoop軟件,或者只能訪問它。就我所見,您並不需要一個根本性的東西 - 它只是您訪問羣集的方式的名稱。

13

+1與戴爾的解釋。在我看來,Hadoop集羣中的邊緣節點通常是負責運行Hadoop集羣客戶端操作的節點。通常,邊緣節點與包含Hadoop服務的節點(例如HDFS,MapReduce等)保持分離,主要是爲了保持計算資源的分離。對於只有少量節點的較小羣集,通常會看到節點扮演主服務(JT,NN等),從服務(TT,DN等)和網關服務角色的混合組合。

請注意,在同一節點上運行主Hadoop服務和從Hadoop服務不是一個理想的設置,並且可能會導致擴展和資源問題,這取決於正在使用的內容。這種配置通常在小規模的開發環境中看到。

隨着中說,這裏的一些問題的答案公佈:

1)是否在邊緣節點必須是集羣 邊緣節點不必是集羣的一部分的一部分,但是如果它在集羣之外(意味着它沒有任何特定的Hadoop服務角色),它需要一些基本的部分,例如Hadoop二進制文件和當前的Hadoop集羣配置文件來在集羣上提交作業。

2)如果它位於集羣內,我們有什麼優勢? 根據使用哪種分佈,羣集內運行的邊緣節點允許集中管理羣集節點上的所有Hadoop配置條目,這有助於減少更新配置文件所需的管理量。通常這是一種一對多的方法,其中配置條目在一個位置更新並推送到羣集中的所有(許多)節點。

但是,當羣集中的其中一個節點也用作邊緣節點時,客戶端操作會消耗CPU和內存資源,從而減少正在運行的Hadoop服務可用的可用資源該節點。

3)它是否在hdfs中存儲任何數據塊? 除非邊緣節點配置了DataNode服務,否則數據塊將不會存儲在該節點上。

4)邊緣節點是否應該在集羣之外?如上所述,它可以依賴於集羣環境和用例;在羣集之外配置它的其中一個支持原因是保持客戶端運行和Hadoop服務分離。

保持邊緣節點分離允許該節點利用可用於Hadoop處理的完整計算資源。

希望這會有所幫助!

0

邊緣節點不過是一個hadoop集羣的守門人,它允許您訪問hadoop應用程序,如蜂巢,豬..而是我會說這是客戶端與集羣談話。