我目前正在研究Lucene.NET全文搜索實現。在大多數情況下,它進行得相當順利,但我有一些問題圍繞數據中的首字母縮寫詞進行旋轉......在Lucene.NET中搜索縮略語的麻煩
作爲一個例子,如果我有「N.A.S.A.」在我索引的領域中,我可以將它與n.a.s.a匹配。或美國國家航空航天局,但是n.a.s.a與它不匹配,即使我進行了模糊搜索(n.a.s.a〜)。
我想到的第一個想法是在索引/搜索之前撕掉所有的。但它似乎更像是一種解決方法而不是解決方案,我希望能得到一個更清晰的解決方案。
任何人都可以建議任何更改或不同的分析器(目前使用StandardAnalyzer),可能更適合匹配這種類型的數據?