我試圖運行Apache Nutch從Eclipse。我遵循http://wiki.apache.org/nutch/RunNutchInEclipse的說明。然而,「parse-html」(包括java和test)的來源都有錯誤。我跑也無妨,它讀取並獲取URL的從seed.txt並返回此錯誤:Eutch中的Nutch錯誤
Fetcher: finished at 2012-03-31 17:21:56, elapsed: 00:00:07
ParseSegment: starting at 2012-03-31 17:21:56
ParseSegment: segment: crawl/segments/20120331172142
Exception in thread "main" java.io.IOException: Job failed!
我想指出的是,我的目標是從獲得指標的Nutch並將其存儲在MongoDB。
我不知道如果Nutch的文件是最新的。最好轉向linux(或VM)並解決它。即使你有辦法解決這個問題,你會得到更多的提前,如果你堅持與Windows – 2012-04-09 18:38:37
我已經在Ubuntu工作。感謝幫助。 – 2012-04-14 11:45:46