我在筆記本電腦上以僞分佈式模式安裝了Hadoop,操作系統是Ubuntu。爲什麼我們每次重啓機器後都需要格式化HDFS?
我已經改變了路徑,其中的Hadoop將(默認的Hadoop將數據存儲在/tmp
文件夾)存儲其數據
hdfs-site.xml
文件看起來如下:
<property>
<name>dfs.data.dir</name>
<value>/HADOOP_CLUSTER_DATA/data</value>
</property>
現在,每當我重新啓動機器,並嘗試啓動hadoop集羣使用start-all.sh
腳本,數據節點永遠不會啓動。我確認數據節點不是通過檢查日誌並使用jps
命令啓動的。
然後我
-
使用
- 停止集羣。
- 使用
hadoop namenode -format
命令格式化的HDFS。 - 使用
start-all.sh
腳本啓動羣集。
stop-all.sh
腳本
現在一切正常,即使我停止並再次啓動羣集。只有當我重新啓動機器並嘗試啓動羣集時纔會出現問題。
- 有沒有人遇到過類似的問題?
- 爲什麼會發生這種情況
- 我們該如何解決這個問題?
這是您的默認位置呢? –
@sonic,我已根據您的評論修改了我的問題。 – Shekhar
你有下面的答案:) –