我使用UAX29URLEmailTokenizerFactory標記器索引SOLR中的一些URI。問題是我的一些URI包含加號字符,SOLR將其解釋爲空格並分割URI。這個問題是否可以通過巧妙的逃避'+'字符來解決?我在分析儀中嘗試了'+',但得到了相同的結果。 這裏是一個域的我確切配置:領先你的分析儀的SOLR索引加字符
<fieldType name="text_general" class="solr.TextField" positionIncrementGap="100">
<analyzer type="index">
<tokenizer class="solr.UAX29URLEmailTokenizerFactory"/>
<filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" enablePositionIncrements="true" />
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
<analyzer type="query">
<tokenizer class="solr.UAX29URLEmailTokenizerFactory"/>
<filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" enablePositionIncrements="true" />
<filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/>
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
</fieldType>
感謝您的想法,它通過將'+'字符替換爲'%2B' – kpentchev