2011-09-07 45 views

回答

1

它是矢量空間模型和布爾模型的組合。檢出Scoring文檔頁面:

Lucene的計分使用信息檢索的向量空間模型(VSM)和布爾模型的組合來確定給定文件的相關程度用戶的查詢。一般來說,VSM背後的思想是查詢術語在文檔中出現的次數相對於術語出現在集合中所有文檔中的次數而言,文檔與查詢的關聯度越高。它使用布爾模型首先根據查詢規範中布爾邏輯的使用縮小需要評分的文檔。

如果您在Similarity與經典VSM formula比較公式,你會注意到它們是相似的(但不等於)。