2014-04-16 29 views
2

的hadoop的jar Apache的Nutch的-1.6.job org.apache.nutch.crawl.Crawl firstSite /網址-dir網址-depth 1 -topN 5如何在Hadoop的

Exception in thread "main" java.io.IOException: Error opening job jar: apache-nutch-1.6.job 
     at org.apache.hadoop.util.RunJar.main(RunJar.java:90) 
Caused by: java.io.FileNotFoundException: apache-nutch-1.6.job (No such file or directory) 
     at java.util.zip.ZipFile.open(Native Method) 
     at java.util.zip.ZipFile.<init>(ZipFile.java:215) 
     at java.util.zip.ZipFile.<init>(ZipFile.java:145) 
     at java.util.jar.JarFile.<init>(JarFile.java:153) 
     at java.util.jar.JarFile.<init>(JarFile.java:90) 
     at org.apache.hadoop.util.RunJar.main(RunJar.java:88) 
+0

任何一個可以幫助我PLZ – santhosh11103

回答

2

眼前的一個Nutch的工作答案是您的apache-nutch-1.6.job丟失或不在當前目錄中。

在編譯nutch(通過'ant')時,運行時/ deploy /中創建了Apache Nutch .job文件(例如apache-nutch-1.9.job)請注意,您需要apache-nutch的源代碼發佈版,而不是二進制版本,創建這個文件。

.job文件實際上是一個JAR文件。它比apache-nutch-1.9.jar大得多,因爲它包含了所有依賴項(以及來自conf /的文件),因此它包含了運行Hadoop作業所需的所有內容。