1
我一直在使用標準分析器在Lucene中進行索引和搜索。我最近遇到了帶狀皰疹(2個字的帶狀皰疹\ bigrams),並且我在我的研究中發現的唯一優點是,短語搜索會更快。 不利的一面是,我的指數增加了。 我不是很確定什麼是真正的優點\我的應用程序將受益於使用帶狀皰疹的功能。 如果我使用Shingles/NGramTokenizer將我的文檔標記爲索引,它將如何影響我的其他現有搜索(Stem \ Fuzzy等搜索)?ShingleFilter n-GramTokenizer的優點?
請問有人可以在這個話題上談一談?