2012-09-10 49 views
0

當我嘗試在hadoop 1.03上運行nutch-1.5時出現以下錯誤。Hadoop 1.03和Nutch 1.5問題

Hadoop的罐子Nutch的-1.5.job org.apache.nutch.crawl.Crawl的URL網址-dir 1 -depth 5 -topN

**Caused by: java.io.IOException: can't find class: org.apache.nutch.protocol.ProtocolStatus because org.apache.nutch.protocol.ProtocolStatus** 

我看到的Nutch-1.3的bug報告https://issues.apache.org/jira/browse/NUTCH-1084但似乎這還沒有解決。 任何幫助表示讚賞。

我按照這個教程:

http://wiki.apache.org/nutch/NutchHadoopTutorial

http://wiki.apache.org/nutch/NutchTutorial

http://wiki.apache.org/hadoop/HowToConfigure

編輯

我按照這個教程http://www.rui-yang.com/develop/build-nutch-1-4-cluster-with-hadoop/,它爲我工作。我不知道究竟是什麼解決了這個問題。我在一個節點上運行hadoop。 我做了這些改變:

1.將hadoop -env.sh,core-site.xml,hdfs-site.xml,mapred-site.xml,master,slave從hadoop/conf複製到nutch/conf,重建Nutch的

2.export CLASSPATH =:$ NUTCH_HOME /運行/ local/lib目錄

我創建了下面的教程http://dataspider.blogspot.com.es/2012/09/instalacion-de-hadoop.html

回答