2011-02-28 53 views
0

我剛剛在1中看到totalHits和scoreHits分別返回查詢的頂部和總點擊數。Lucene:查詢的命中是什麼?

「命中」是什麼意思?它是文檔中搜索到的術語的位置,還是包含該術語的文檔或什麼?

謝謝

回答

1

totalHits是匹配查詢的文檔數。命中本質上與您輸入的查詢匹配。然而命中可能是部分匹配或完全匹配

例如,如果我們在一組的3個文字使用的Lucene索引:{「世界你好」,「你好水手」,「晚安,月亮」},然後搜索:你好世界

總點擊數:2

1.078打招呼世界

0.181你好水手

浮動值指示命中,這是相關的查詢字符串的分數。

以下職位提供了更多的細節http://lingpipe-blog.com/2009/02/18/lucene-24-in-60-seconds/

+0

OK,但是totalHits仍然是一個有點混亂。它是類TopDocs的一種方法,它是最相關的文檔(在我的例子中,我已經設置了20個文檔的限制。TopDocs docs = searcher.search(query,20);所以totalHits應該始終爲20 ... ?! – aneuryzm

+0

@Patrick,如果有20個實際匹配,totalHits將只有20個。在20個以上實際匹配的情況下,你所做的是將totalHits限制爲20。 – Paul