0 我嘗試將Nutch配置爲圖像抓取工具,並且可以在抓取後獲取圖像網址。 現在,我想要獲得每個圖像url的種子URL,我該怎麼做? 謝謝!Nutch:獲取每個網址的種子網址 來源 2012-01-26 juffun
0 嘗試從抓取的網段生成linkdb(倒排索引),您可能會收到urls的父母。如果網址有一個父母,那麼它將是該網址的種子。 閱讀this和this以獲得有關命令的幫助。 來源 2012-04-03 15:24:11