0
前段時間我遇到了extended boolean model,它將布爾檢索邏輯與排列文檔的能力結合起來,類似於向量空間模型。Lucene是否使用擴展布爾模型檢索?
據我所知,這正是Lucene在排序文件時的工作方式。我對嗎?
前段時間我遇到了extended boolean model,它將布爾檢索邏輯與排列文檔的能力結合起來,類似於向量空間模型。Lucene是否使用擴展布爾模型檢索?
據我所知,這正是Lucene在排序文件時的工作方式。我對嗎?
它是矢量空間模型和布爾模型的組合。檢出Scoring文檔頁面:
Lucene的計分使用信息檢索的向量空間模型(VSM)和布爾模型的組合來確定給定文件的相關程度用戶的查詢。一般來說,VSM背後的思想是查詢術語在文檔中出現的次數相對於術語出現在集合中所有文檔中的次數而言,文檔與查詢的關聯度越高。它使用布爾模型首先根據查詢規範中布爾邏輯的使用縮小需要評分的文檔。
如果您在Similarity與經典VSM formula比較公式,你會注意到它們是相似的(但不等於)。