1
在版本4.x之前,可以使用0.1到1.0之間的浮點數設置模糊搜索的相似度。 更高版本使用介於0和2之間的值作爲編輯距離。Lucene 3.0.3 - 模糊搜索相似度如何與更高版本的編輯距離相關聯? (例如4.x)
這些值是如何相關的?我在文檔中的任何地方都找不到0.1到1.0的實際浮動範圍。
我使用lucene.net 3.0.3
在版本4.x之前,可以使用0.1到1.0之間的浮點數設置模糊搜索的相似度。 更高版本使用介於0和2之間的值作爲編輯距離。Lucene 3.0.3 - 模糊搜索相似度如何與更高版本的編輯距離相關聯? (例如4.x)
這些值是如何相關的?我在文檔中的任何地方都找不到0.1到1.0的實際浮動範圍。
我使用lucene.net 3.0.3
4.0版以後只需使用一個Damerau-Levenshtein edit distance。
版本3.0.3將編輯距離與術語長度進行比較。如果length(term) * minSimilarity >= edit distance
(其中minSimilarity是您所指的float參數),則該術語被認爲是匹配的。
因此,如果將其設置爲0.5,則長度爲4的項可以具有高達2的編輯距離,而長度爲6的項可以具有3的距離並且仍然匹配。