我希望有不同的項目,不同的數據節點兩個集羣(不想之間共享數據節點的兩個項目)如何管理使用一個Cloudera的經理,共享NN&YARN服務器
我可以看到選項Cloudera Manger使用共享cloudera管理器來創建兩個不同的羣集。因此,我可以將單獨的數據節點集羣與早期集羣共享HDFS和Yarn管理器。 Yarn/HDFS主服務必須有兩個獨立的fsimage /編輯日誌和資源管理器(我想我的主節點上的服務器配置將與新集羣數據節點和安裝的客戶端進程共享)。
可能嗎?有沒有人做過之前。表現如何? 我指的是這個文件 - [使用一個CM http://www.cloudera.com/documentation/archive/manager/4-x/4-5-1/Cloudera-Manager-Enterprise-Edition-User-Guide/cmeeug_topic_6.html][ Cloudera的文檔,多集羣]
而且> 可我們設置一些規則HDFS存儲/使用特定的一組數據節點的特定數據集/目錄的只有這麼這種分離可以實現?
在此先感謝。
僅計劃使用MapReduce和Spark。我只是想將現有的Yarn/HDFS NN服務用於新添加的數據節點,這樣我們就不必投資新的2-3個服務器節點(NN,SNN,YARN RM,Edge節點等)支持活動將會順利進行。現有項目正在全部利用所有資源RAM/CPU。因此只是想檢查是否有可能避免與已經過載的集羣共享負載數據節點(現有數據節點上的CPU和RAM利用率爲90%,因此具有單獨的處理流程如果可能,使用單獨的DN)。 – Yogesh
我們是否也可以爲HDFS設置一些規則來存儲/使用特定數據/目錄集的特定數據節點,以便實現分離? – Yogesh