0
我有db.max.anchor.length設置爲5,但nutch仍然提取具有錨定長度大於5的地址,例如:http://mysite/somepage.htm,什麼是這是爲什麼?我正在使用nutch-1.2。db.max.anchor.length屬性nutch-default.xml
我有db.max.anchor.length設置爲5,但nutch仍然提取具有錨定長度大於5的地址,例如:http://mysite/somepage.htm,什麼是這是爲什麼?我正在使用nutch-1.2。db.max.anchor.length屬性nutch-default.xml
財產db.max.anchor.length
只有在創建linkdb
(倒排索引)時纔有效。對於正常的爬行,它不會限制錨的大小。