0
當發佈xml文檔索引到solr時,一些文檔正在增加並且重複的記錄被丟棄。一些記錄也會隨着新值一起更新。我如何知道對索引進行的這些更改。我的意思是我將如何知道添加的記錄數量,不。更新記錄,發佈到solr核心的文檔數量?我如何知道在solr索引中更改,更新和索引的文檔?
當發佈xml文檔索引到solr時,一些文檔正在增加並且重複的記錄被丟棄。一些記錄也會隨着新值一起更新。我如何知道對索引進行的這些更改。我的意思是我將如何知道添加的記錄數量,不。更新記錄,發佈到solr核心的文檔數量?我如何知道在solr索引中更改,更新和索引的文檔?
在Solr 4中,在集合的部分下,有一個子部分叫做Plugins/Stats。其中,有UpdateHandler類別的統計類似於你所要求的。
此外,可以觀察變化。綜合起來,這可能會給你一個方法,看看這些是你想要的。如果是,那麼您應該通過JMX訪問相同的值以進行更靈活/長期的跟蹤。
http:// localhost:8983/solr/collection1/admin/mbeans?stats = true 此網址只顯示索引,張貼和丟棄文檔的數量。但我想知道文檔編號索引(添加)的編號,在發佈索引文檔時刪除。我正在執行文檔重複檢測。所以我想知道solr丟棄的重複文檔。 –
還是有什麼辦法知道文件是否已經存在於solr-index之前發佈新的xml文件到solr? –
這些問題似乎與您從一開始就非常不同。我建議關閉這個並重新開始。但很快,請查看UpdateRequestProcessors,或者查看現有Solr Dedupe組件的源代碼。 –