2010-11-11 51 views
0

我正在使用Lucene seacrh引擎進行全文搜索,它也給非ascii字符的搜索結果,但問題是假設我添加了一個文本帕普部分分配數量,並將與 一起搜索只有一個字符帕它會給出結果,但什麼時候會用完整的非ASCII字搜索帕普部分分配數量並沒有給出任何結果,奇怪的是當我在每個字符之間放置空格時,例如帕普部分分配數量和theb將搜索它給結果Lucene不搜索完整的非ASCII字符

會真的感謝所有幫助

感謝名單

回答

0

索引和搜索時一定要使用相同的Analyzer

會發生什麼事是你Analyzer正在索引每個字符作爲一個單獨的Term,然後如果你用不同的分析儀(IE WhiteSpaceAnalyzer)搜索一下搜索包含在你的查詢所有指定的字符令牌。

要搜索您想要的字符序列,您需要使用相同的Analyzer並使QueryParser與所有單個令牌一起構建PhraseQuery

您的索引和搜索例程的一些示例代碼將使您更容易幫助您。