Lucene不搜索完整的非ASCII字符

我正在使用Lucene seacrh引擎進行全文搜索，它也給非ascii字符的搜索結果，但問題是假設我添加了一個文本帕普部分分配數量，並將與一起搜索只有一個字符帕它會給出結果，但什麼時候會用完整的非ASCII字搜索帕普部分分配數量並沒有給出任何結果，奇怪的是當我在每個字符之間放置空格時，例如帕普部分分配數量和theb將搜索它給結果Lucene不搜索完整的非ASCII字符

會真的感謝所有幫助

感謝名單

來源

2010-11-11 BreakHead

索引和搜索時一定要使用相同的Analyzer。

會發生什麼事是你Analyzer正在索引每個字符作爲一個單獨的Term，然後如果你用不同的分析儀（IE WhiteSpaceAnalyzer）搜索一下搜索包含在你的查詢所有指定的字符令牌。

要搜索您想要的字符序列，您需要使用相同的Analyzer並使QueryParser與所有單個令牌一起構建PhraseQuery。

您的索引和搜索例程的一些示例代碼將使您更容易幫助您。

來源

2010-11-16 16:13:22

Lucene不搜索完整的非ASCII字符

回答

相關問題