0
我正在使用Lucene seacrh引擎進行全文搜索,它也給非ascii字符的搜索結果,但問題是假設我添加了一個文本帕普部分分配數量,並將與 一起搜索只有一個字符帕它會給出結果,但什麼時候會用完整的非ASCII字搜索帕普部分分配數量並沒有給出任何結果,奇怪的是當我在每個字符之間放置空格時,例如帕普部分分配數量和theb將搜索它給結果Lucene不搜索完整的非ASCII字符
會真的感謝所有幫助
感謝名單
我正在使用Lucene seacrh引擎進行全文搜索,它也給非ascii字符的搜索結果,但問題是假設我添加了一個文本帕普部分分配數量,並將與 一起搜索只有一個字符帕它會給出結果,但什麼時候會用完整的非ASCII字搜索帕普部分分配數量並沒有給出任何結果,奇怪的是當我在每個字符之間放置空格時,例如帕普部分分配數量和theb將搜索它給結果Lucene不搜索完整的非ASCII字符
會真的感謝所有幫助
感謝名單
索引和搜索時一定要使用相同的Analyzer
。
會發生什麼事是你Analyzer
正在索引每個字符作爲一個單獨的Term
,然後如果你用不同的分析儀(IE WhiteSpaceAnalyzer
)搜索一下搜索包含在你的查詢所有指定的字符令牌。
要搜索您想要的字符序列,您需要使用相同的Analyzer
並使QueryParser
與所有單個令牌一起構建PhraseQuery
。
您的索引和搜索例程的一些示例代碼將使您更容易幫助您。