2014-03-28 67 views
0

搜索在solr 4.7中無法顯示西班牙字符(如ñ和Ñ)的正確結果。我搜索了solr幫助,發現字符不在ASCII範圍內。搜索結果solr 4.7中的西班牙字符不匹配

如何映射非ASCII字符與ASCII字符? 例如:在索引索引中,我們使用字符ñ,Ñ[拉丁文大寫字母N與TILDE]或正常的n,N 應使用什麼過濾器/標記來使用Normal N或Ñ進行搜索,兩者都應映射?

字符Ń[拉丁文大寫字母N WITH ACUTE]作爲例外。

+0

看看這裏http://stackoverflow.com/questions/22714285/solr-how-to-search-n-and-n-with-normal-char-n-and-vice-verse – cheffe

+1

它確實不起作用,因爲字符和Ñ不在ASCII字符範圍內,它們是非ASCII字符。 我想要它,當我搜索單詞Cañen時,它應該爲我提供包含單詞「cañen」以及「canen」的結果。 – Arbflow

回答

1

我嘗試使用the ICUFoldingFilterFactory這與這些口音很好。如果這是一個棘手成立,看看到SO質疑Can not use ICUTokenizerFactory in Solr

該分析儀

<fieldType name="spanish" class="solr.TextField"> 
    <analyzer> 
     <tokenizer class="solr.StandardTokenizerFactory" /> 
     <filter class="solr.ICUFoldingFilterFactory" /> 
    </analyzer> 
</fieldType> 

讓我這些分析結果,屏幕截圖是從Solr的管理員採取

analysis results from solr-admin for Spanish input