2011-08-17 63 views

回答

0

我的建議是不保留重複的文章。因此,您需要一種方法來識別這些重複的文章並將其從一個SOLR中刪除。

如果你不想刪除重複的文章,你仍然需要跟蹤它們。 知道哪些物品從SOLR1在SOLR2重複將幫助您刪除重複的計數是這樣的:當你查詢到

IsDuplicateField = true, if article is duplicated in SOLR2 
       = false, otherwise 
    • 創建SOLR1一個額外的字段命名SOLR1 add:IsDuplicatedField = true to facets。

    • 檢索結果只是減少SOLR1中IsDuplicateField總數的方面總數。

    在這種情況下,方面IsDuplicateField將檢索所有重複且匹配您的查詢的文章。

    祝你好運!

  • +0

    謝謝Dorin!我們現在使用合併排序相似的方法在索引完成後去除文檔的重複。我會稍後嘗試你的解決方案! –