2
如果Nutch已經在索引中,它會再次索引頁面嗎?如果是這樣,我該如何改變這一點?Nutch,蜘蛛,索引網頁它已經在它的索引?
如果Nutch已經在索引中,它會再次索引頁面嗎?如果是這樣,我該如何改變這一點?Nutch,蜘蛛,索引網頁它已經在它的索引?
是的,沒有。默認情況下,Nutch只會在一段時間後(從內存中)重新索引頁面,如果頁面沒有改變,它會延遲增加重新索引時間,默認最多爲3個月。 所有設置均可在nutch-site.xml中配置