我想試驗與Solr的模糊匹配。Solr/lucene最大字符模糊匹配
在我提到的「MYNEWORGANIZATION20SEP2011」這個文件索引的first_name字段中 - 實際上這個詞是「My New Organization 20-Sep-2011」,但我刪除了空格和其他字符。
現在上面的單詞(沒有空格)如果我直接搜索查詢「MYNEWORGANIZATION20SEP2011」Solr得到1結果如上文件ID,完美!
但是,如果我從這個字符串中修剪兩個字符,並在查詢如果我提供「MYNEWORGANIZATION20SEP20〜0.8」,我得到0結果。
與主文檔數據我新的查詢MYNEWORGANIZATION20SEP20距離爲2 - 因而%的匹配應> 90%匹配,因此應該還是搜索數據(我的查詢中,我僅指定了80%的比賽
。順便說一句,如果我使用first_name作爲6-7字符,如「rushik」,並提供模糊查詢,如「rushik〜0.75」,則搜索正常並返回數據。 「text_general」 - 使用solr 3.3。
Solr中有模糊搜索的字符限制嗎?它可以是可配置的在哪裏? - 我正在使用默認的solr配置,沒有改變solrconfig.xml中的任何東西
有沒有更好的方式來搜索「My New Organization 20-Sep-2011」像模糊查詢字符串,而無需手動刪除空格。
謝謝, Rushik。
您可以驗證降低所需的相似性是否找到結果? – Xodarap
我驗證,直到0.2,0.1絕對應該匹配,但仍然沒有運氣。 – Rushik