經過大量搜索,似乎沒有任何關於如何在Solr中使用Nutch 1.3的直接解釋。簡單的Nutch 1.3/Solr索引解釋
我有一個Solr索引與其中的其他內容,我將用於搜索網站。
我想將Nutch結果添加到索引中,這會將外部網站添加到網站的搜索中。
所有這一切都工作得很好。
問題是,你如何清新指數?您是否必須先刪除Solr中的所有Nutch結果?或者Nutch是否照顧這個? Nutch是否刪除Solr索引中不再有效的結果?
沒有任何文檔或解釋他們正在做的shell腳本沒有幫助回答這些問題。
它如何修剪不再在其爬網的網站上的文檔? – Karl
默認情況下不會發生這種情況。爲了實現這一目標,您需要從索引中刪除網站的所有結果,然後運行刷新抓取。可以在將新數據提交給solr索引之前完成刪除操作,以便在更新抓取完成之前獲得結果。 – Umar
這是nutch可以做的嗎?我沒有看到有關刪除索引外的任何內容。 – Karl