在Windows 7中運行Apache Nutch

我想用Cygwin運行Nutch。我有爬的內容中的問題在Windows 7中運行Apache Nutch

我的評論是

$斌/ Nutch的抓取網址-dir爬-depth 3 -topN 5

響應是

** cygpath：可以」 t轉換空路徑

InjectorJob：使用class org.apache.gora.memory.store.MemStore作爲Gora存儲類。異常線程「main」產生java.io.IOException：無法設置路徑的權限：\ tmp目錄\ Hadoop的用戶\ mapred \分期\ user1249593824.staging至0700 **

at org.apache.hadoop.fs.FileUtil.checkReturnValue(FileUtil.java:691) 
    at org.apache.hadoop.fs.FileUtil.setPermission(FileUtil.java:664) 
    at org.apache.hadoop.fs.RawLocalFileSystem.setPermission(RawLocalFileSystem.java:514) 
    at org.apache.hadoop.fs.RawLocalFileSystem.mkdirs(RawLocalFileSystem.java:349) 
    at org.apache.hadoop.fs.FilterFileSystem.mkdirs(FilterFileSystem.java:193) 
    at org.apache.hadoop.mapreduce.JobSubmissionFiles.getStagingDir(JobSubmissionFiles.java:126) 
    at org.apache.hadoop.mapred.JobClient$2.run(JobClient.java:942) 
    at org.apache.hadoop.mapred.JobClient$2.run(JobClient.java:936) 
    at java.security.AccessController.doPrivileged(Native Method) 
    at javax.security.auth.Subject.doAs(Subject.java:415) 
    at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1190) 
    at org.apache.hadoop.mapred.JobClient.submitJobInternal(JobClient.java:936) 
    at org.apache.hadoop.mapreduce.Job.submit(Job.java:550) 
    at org.apache.hadoop.mapreduce.Job.waitForCompletion(Job.java:580) 
    at org.apache.nutch.util.NutchJob.waitForCompletion(NutchJob.java:50) 
    at org.apache.nutch.crawl.InjectorJob.run(InjectorJob.java:233) 
    at org.apache.nutch.crawl.Crawler.runTool(Crawler.java:68) 
    at org.apache.nutch.crawl.Crawler.run(Crawler.java:136) 
    at org.apache.nutch.crawl.Crawler.run(Crawler.java:250) 
    at org.apache.hadoop.util.ToolRunner.run(ToolRunner.java:65) 
    at org.apache.nutch.crawl.Crawler.main(Crawler.java:257)

幫我在這。

來源

2013-10-01 RamaKrishnan Muthu

檢查您的配置對[http://amac4.blogspot.com/2013/07/configuring-nutch-to-crawl-urls.html] –

我在這之前2天有同樣的問題。下面是/lib/hadoop-core-1.2.0.jar與下載的文件具有相同的名稱重新命名它，我跟着

下載http://mvnrepository.com/artifact/org.apache.hadoop/hadoop-core/0.20.2
更換（Nutch的目錄）的解決方案。

就是這樣。

來源

2014-09-19 12:38:20 Kumar

謝謝。此解決方案爲我工作 –

如果答案是正確的，接受答案並投入upvote。很高興它對你有效。 – Kumar

在Windows 7中運行Apache Nutch

回答

相關問題