2014-01-26 66 views
10

我正在學習Hadoop,目前我正在嘗試設置一個Hadoop 2.2.0單節點。我下載了最新的發行版,解壓縮了它,現在我試圖設置Hadoop分佈式文件系統(HDFS)。Hadoop 2.2.0中HDFS的配置文件在哪裏?

現在,我試圖按照可用的Hadoop指令here,但我很迷茫。

在你看到有引用下列文件左邊欄:

  • 核心default.xml中
  • HDFS-default.xml中
  • mapred-default.xml中
  • yarn- default.xml

但這些文件是如何?

我發現/etc/hadoop/hdfs-site.xml,但它是空的!

我發現/share/doc/hadoop/hadoop-project-dist/hadoop-common/core-default.xml但它只是一個文檔!

那麼,我必須修改哪些文件來配置HDFS?窟窿值是從哪裏讀取的?

在此先感謝您的幫助。

回答

13

這些文件都在hadoop/conf目錄中。

要設置HDFS,您必須配置core-site.xml和hdfs-site.xml。

HDFS有兩種工作模式:分佈式(多節點集羣)和僞分佈式(一臺機器的集羣)。

對於僞分佈式模式下,您必須配置:

在覈心的site.xml:

<!-- namenode --> 
<property> 
    <name>fs.default.name</name> 
    <value>hdfs://localhost:8020</value> 
</property> 

在HDFS-site.xml中:

<-- storage directories for HDFS - the hadoop.tmp.dir property, whose default is /tmp/hadoop-${user.name} --> 
<property> 
    <name>hadoop.tmp.dir</name> 
    <value>/your-dir/</value> 
</property> 

每個屬性都有其硬編碼的默認值。

請記得在啓動HDFS之前爲hadoop用戶設置ssh無密碼登錄。

P.S.

它從Apache Hadoop的下載,你可以考慮切換到Hadoop發行版:

Cloudera's CDH,HortonWorks或MAPR。

如果安裝Cloudera CDH或Hortonworks HDP,您可以在/ etc/hadoop/conf /中找到這些文件。

+1

感謝您指點我Cloudera的CDH。目前我的目的是瞭解如何從頭開始使用Hadoop,如果你明白我的意思,只是爲了理解至少所有的部分。我同意像你指出的分發可能是更快的解決方案。 – danidemi

+1

在這種情況下,我建議您閱讀Oreilly的Hadoop權威指南2012版。 –

4

所有的配置文件都將位於etc/hadoop /目錄下提取的tar.gz文件中。 hdfs-site.xml可能是hdfs-site.xml.template。您需要將其重命名爲hdfs-site.xml。

如果你想看到什麼HDFS選項選中文檔中的份額/ DOC/Hadoop的/ Hadoop的項目 - 距離/ Hadoop的HDFS/HDFS-default.xml中

5

壓縮包安裝Hadoop的2.2。 0你關注this link。這是「0.23.9」,但它對於「2.2.0」絕對正常

+0

感謝分享的鏈接,這的確是一個非常好的做過教程。 – danidemi

0

這些文件可以在這裏看到/usr/lib/hadoop-2.2.0/etc/hadoop,在那個位置你可以找到所有的XML。

1

對於Hortonworks地點是

/etc/hadoop/conf/hdfs-site.xml