0
現在我用的是後續的命令來抓取網站:Nutch如何抓取一個網站的所有鏈接?
bin/nutch generate -topN 20
bin/nutch fetch -all
bin/nutch parse -all
bin/nutch updatedb
但這種方法需要花費很長時間才具有從該網站的所有鏈接。我想抓取一個網站並獲取所有鏈接。
我該如何做到這一點?
現在我用的是後續的命令來抓取網站:Nutch如何抓取一個網站的所有鏈接?
bin/nutch generate -topN 20
bin/nutch fetch -all
bin/nutch parse -all
bin/nutch updatedb
但這種方法需要花費很長時間才具有從該網站的所有鏈接。我想抓取一個網站並獲取所有鏈接。
我該如何做到這一點?
bin/nutch crawl
是你正在尋找的命令