我對Hadoop分佈式文件系統的設置以及我的特定設置如何影響它有點困惑。我使用本指南在Virtual Box上使用兩臺虛擬機來設置它http://www.michael-noll.com/tutorials/running-hadoop-on-ubuntu-linux-multi-node-cluster/,並運行該示例(只是使用txt文件輸入的簡單字數)。到目前爲止,我知道datanode管理和檢索節點上的文件,而tasktracker分析數據。Hadoop DFS的CopyFromLocal命令如何工作?
1)當你使用命令-copyFromLocal,你是複製文件/輸入到HDFS? Hadoop是否知道如何劃分從站/主站之間的信息,它是如何實現的?
2)在上面鏈接指南中概述的配置中,技術上有兩個從站(主站作爲主站和從站)?這是常見的還是主機通常只給jobtracker/namenode任務?