當我嘗試在hadoop 1.03上運行nutch-1.5時出現以下錯誤。Hadoop 1.03和Nutch 1.5問題
Hadoop的罐子Nutch的-1.5.job org.apache.nutch.crawl.Crawl的URL網址-dir 1 -depth 5 -topN
**Caused by: java.io.IOException: can't find class: org.apache.nutch.protocol.ProtocolStatus because org.apache.nutch.protocol.ProtocolStatus**
我看到的Nutch-1.3的bug報告https://issues.apache.org/jira/browse/NUTCH-1084但似乎這還沒有解決。 任何幫助表示讚賞。
我按照這個教程:
http://wiki.apache.org/nutch/NutchHadoopTutorial
http://wiki.apache.org/nutch/NutchTutorial
http://wiki.apache.org/hadoop/HowToConfigure
編輯
我按照這個教程http://www.rui-yang.com/develop/build-nutch-1-4-cluster-with-hadoop/,它爲我工作。我不知道究竟是什麼解決了這個問題。我在一個節點上運行hadoop。 我做了這些改變:
1.將hadoop -env.sh,core-site.xml,hdfs-site.xml,mapred-site.xml,master,slave從hadoop/conf複製到nutch/conf,重建Nutch的
2.export CLASSPATH =:$ NUTCH_HOME /運行/ local/lib目錄
我創建了下面的教程http://dataspider.blogspot.com.es/2012/09/instalacion-de-hadoop.html