2012-05-09 48 views
1

我使用這個命令抓取某些網址:如何配置nutch 1.4?

./bin/nutch crawl urls/urls -dir crawl -depth 2 

它顯示了以下錯誤:

Could not find or load main class org.apache.nutch.crawl.Crawl 

我怎樣才能解決這個問題?

+0

看起來像'$ CLASSPATH'的問題。即所需的.class文件不在''CLASSPATH'中,nutch'腳本爲它自己設置。你是如何安裝nutch的?你按照[這些說明](http://wiki.apache.org/nutch/NutchTutorial)?如果沒有,請嘗試一下,與我們分享,哪一步失敗。 – ArjunShankar

回答

2

看到這裏http://www.params.me/2011/07/apache-nutch-13-setup.html

這些步驟爲我工作。如果您遇到任何問題,請告訴我。

+0

謝謝,工作 –

+0

可以用hadoop配置nutch 1.4 0.20 –

+1

看這個http://www.rui-yang.com/develop/build-nutch-1-4-cluster-with-hadoop/ –