我收到了一個包含一些pdf文件鏈接的網站。 我希望nutch抓取該鏈接並將它們轉儲爲.pdf文件。 我使用的Apache Nutch1.6也是我在Java作爲如何使用Apache Nutch抓取.pdf鏈接
ToolRunner.run(NutchConfiguration.create(), new Crawl(),
tokenize(crawlArg));
SegmentReader.main(tokenize(dumpArg));
特林這可以有人幫助我在此