0

問題雖然Hadoop的多節點建立。隨着一聲我的主(BIN/start-dfs.sh)開始我的HDFS妖錯誤Hadoop的多節點集羣上啓動HDFS守護進程

我也得到了下面的日誌在主

starting namenode, logging to /home/hduser/hadoop/libexec/../logs/hadoop-hduser-namenode-localhost.localdomain.out 
slave: Warning: $HADOOP_HOME is deprecated. 
slave: 
slave: starting datanode, logging to /home/hduser/hadoop/libexec/../logs/hadoop-hduser-datanode-localhost.localdomain.out 
master: Warning: $HADOOP_HOME is deprecated. 
master: 
master: starting datanode, logging to /home/hduser/hadoop/libexec/../logs/hadoop-hduser-datanode-localhost.localdomain.out 
master: Warning: $HADOOP_HOME is deprecated. 
master: 
master: starting secondarynamenode, logging to /home/hduser/hadoop/libexec/../logs/hadoop-hduser-secondarynamenode-localhost.localdomain.out 

我也得到了以下關於從日誌@

Hadoop的hduser-數據節點,localhost.localdomain.log文件

有些人可能會提醒我,設置有什麼問題。

2013-07-24 12:10:59,373 INFO org.apache.hadoop.ipc.Client: Retrying connect to server: master/192.168.0.1:54310. Already tried 8 time(s); retry policy is RetryUpToMaximumCountWithFixedSleep(maxRetries=10, sleepTime=1 SECONDS) 
2013-07-24 12:11:00,374 INFO org.apache.hadoop.ipc.Client: Retrying connect to server: master/192.168.0.1:54310. Already tried 9 time(s); retry policy is RetryUpToMaximumCountWithFixedSleep(maxRetries=10, sleepTime=1 SECONDS) 
2013-07-24 12:11:00,377 ERROR org.apache.hadoop.hdfs.server.datanode.DataNode: java.io.IOException: Call to master/192.168.0.1:54310 failed on local exception: java.net.NoRouteToHostException: No route to host 
     at org.apache.hadoop.ipc.Client.wrapException(Client.java:1144) 
     at org.apache.hadoop.ipc.Client.call(Client.java:1112) 

回答

1

確保您的NameNode運行正常。如果它已經在運行,請查看連接是否有問題。您的DataNode無法與NameNode進行通話。確保在從站的文件/etc/hosts中添加了本機的IP和主機名。嘗試telnet到192.168.0.1:54310,看看你能否連接。

向我們展示NN日誌會很有幫助。

編輯:

看看wiki有說這個問題: 你得到一個TCP沒有到主機的路由包在一個Java IOException異常錯誤 - 通常,當網絡上的一臺機器不知道如何向指定的機器發送TCP數據包。

一些可能的原因(不是排他性的列表):

  • 遠程計算機的主機名是錯誤的配置文件。
  • 客戶端的主機表// etc/hosts對目標主機有一個無效的IP地址。
  • DNS服務器的主機表具有目標主機的無效IP地址。
  • 客戶端的路由表(Linux,iptables)是錯誤的。
  • DHCP服務器正在發佈錯誤的路由信息​​。
  • 客戶端和服務器位於不同的子網上,並且未設置爲彼此通信。這可能是一個意外,或者是故意鎖定Hadoop集羣。
  • 機器正在嘗試使用IPv6進行通信。 Hadoop目前不支持IPv6
  • 主機的IP地址已更改,但是長時間使用的JVM正在緩存舊值。這是JVM的一個已知問題(有關詳細信息和解決方案,請搜索「Java反向DNS緩存」)。

快速解決方案:重新啓動JVM。

這些都是網絡配置/路由器問題。因爲它是你的網絡,只有你可以找出並追蹤問題。

+0

我在大師和基金做了JPS命令[根@本地設置]#JPS 3359的DataNode 3744個JPS 3242 NameNode的 3500 SecondaryNameNode 他們都在漲,但是從沒有運行服務[hduser @本地日誌] $ JPS 4384 JPS – Surya

+0

無法連接到遠程登錄,我也試圖從從遠程登錄到高手[hduser @本地日誌] $遠程登錄192.168.0.1:54310 的telnet:192.168.0.1:54310:產品名稱或服務不知道 192.168.0.1 :54310:未知主機 – Surya

+1

看起來像一些網絡相關的問題。你能夠ssh嗎?確保機器連接正確。另外,確保所有守護進程都在所有機器上運行。 – Tariq

相關問題