2013-05-13 76 views
1

我遵循Apache Nutch Wiki中的每一步。我使用的是MacOSX 10.8.3,我的JAVA_HOME已經完美設置,當bin/nutch執行時(甚至根據wiki),甚至可以看到各種命令選項。Apache Nutch命令無法執行

但是當我使用bin/nutch crawl urls -dir crawl -depth 3 -topN 5,我得到以下錯誤:

bin/nutch: line 104: [: too many arguments 
Error: Could not find or load main class Engines 

FYI:我已經創建了一個urls目錄apache-nutch-1.6/urls

任何一個可以告訴可能是什麼問題?

+0

你可以說你的命令在其文件路徑('的命令pwd'響應)上運行? – cguzel 2013-05-14 12:00:19

回答

0

你可以嘗試如下:

首先,通過建立螞蟻的Nutch。

cd nutch-1.x.x/runtime/local/

mkdir urls(種子名單目錄)

mkdir crawl(爲​​選項)

vim urls/seed,然後添加一個或多個網址(例如:http://www.examplesite.com

bin/nutch crawl urls - 或 - bin/nutch crawl urls -dir crawl -depth 3 -topN 5

0

經過一番研究,我發現我忘了設置NUTCH_JAVA_HOME。 下面是步驟:

set NUTCH_JAVA_HOME=/System/Library/Frameworks/JavaVM.framework/Versions/1.6/Home 
export NUTCH_JAVA_HOME 

是的,我重新設置JAVA_HOME還有:

set JAVA_HOME=/System/Library/Frameworks/JavaVM.framework/Versions/1.6/Home 
export JAVA_HOME