我們正在將AWS MapReduce從我們自己的機架上遷移到Hadoop集羣。最初我們將有7臺專用於Hadoop/HDFS的服務器。擁有7臺服務器的Hadoop架構 - 平衡連續性和性能
我們在HDFS上存儲的數據將是關鍵任務,我不希望我們有備份選項(至少不是在我們使用的第一天),所以我想盡我所能保證連續性。
我還想充分利用我們的計算能力,因爲我們有的工作可以輕鬆使用雙倍的硬件。
- 我應該在這個7服務器羣集的每個盒子裏註明什麼?特別是哪些進程應該重疊(例如,應備份的NameNode分享一盒任務節點和相似?)
我們將嘗試使用LXC容器來分隔各個進程(任務節點,名稱節點,輔助名稱節點,主節點),並將名稱節點,輔助節點和主節點與任務節點重疊(如同這些服務器所有的都有一個大的磁盤和比名稱節點或主節點需要更多的cpu +內存)。我們將使用cgroups來保證master和namenodes的資源。我們將來會在我們嘗試過的時候自己回答這個問題。 – 2013-03-26 05:02:21
你有沒有去實現這個? – cabad 2013-10-17 21:06:05