0
我們使用兩個solrs來索引文件。有時候一篇文章會被索引,因爲我們會更新。它會導致由於這些重複的文章導致方面計數不正確的問題。我如何去重複計數?Solr方面計數不正確,如何進行重複數據刪除
我們使用兩個solrs來索引文件。有時候一篇文章會被索引,因爲我們會更新。它會導致由於這些重複的文章導致方面計數不正確的問題。我如何去重複計數?Solr方面計數不正確,如何進行重複數據刪除
我的建議是不保留重複的文章。因此,您需要一種方法來識別這些重複的文章並將其從一個SOLR中刪除。
如果你不想刪除重複的文章,你仍然需要跟蹤它們。 知道哪些物品從SOLR1在SOLR2重複將幫助您刪除重複的計數是這樣的:當你查詢到
IsDuplicateField = true, if article is duplicated in SOLR2
= false, otherwise
:
創建SOLR1一個額外的字段命名SOLR1 add:IsDuplicatedField = true to facets。
在這種情況下,方面IsDuplicateField將檢索所有重複且匹配您的查詢的文章。
祝你好運!
謝謝Dorin!我們現在使用合併排序相似的方法在索引完成後去除文檔的重複。我會稍後嘗試你的解決方案! –