我發現這對Lucene的Similarity
類public float idf(Term term, Searcher searcher)
方法的javadoc:爲什麼Lucene使用maxDoc而不是numDocs來計算term idf?
注意Searcher.maxDoc()是用來代替的IndexReader#numDocs() 因爲還Searcher.docFreq(期限)時,當後者是 不準確,所以是Searcher.maxDoc(),並在相同的方向。在 另外,Searcher.maxDoc()計算效率更高。
這對我來說不太合理。這是否與索引讀取器中的文檔刪除有關?
看來你已經回答了不少我的問題。謝謝 :-) – Denzel