2013-03-28 28 views
0

我在SOLR模式中有一個多值字段。我想知道是否有一個現有的標記器/過濾器可以刪除空間。例如,給定「solr,apache solr,倒排索引」,我希望將它們作爲「solr,apachesolr,invertedindex」。Solr中的空間摺疊Tokenizer /濾波器

回答

1

在該字段的索引時間內,您可以使用PatternReplaceCharFilterFactory作爲分析器鏈中的第一個條目。因此,在您schema.xml中定義一個新的字段類型如下:

<fieldtype name="text_no_ws" class="solr.TextField"> 
    <analyzer> 
    <charFilter class="solr.PatternReplaceCharFilterFactory" 
       pattern=" " replacement=""/> 
    ... 

,然後用其作爲類型的字段,如:

<field name="keywords" type="text_no_ws" multiValued="true" ... />