2014-03-27 126 views
0

現在我用的是後續的命令來抓取網站:Nutch如何抓取一個網站的所有鏈接?

bin/nutch generate -topN 20 
bin/nutch fetch -all 
bin/nutch parse -all 
bin/nutch updatedb 

但這種方法需要花費很長時間才具有從該網站的所有鏈接。我想抓取一個網站並獲取所有鏈接。

我該如何做到這一點?

回答

0

bin/nutch crawl是你正在尋找的命令

相關問題