0
我在SOLR模式中有一個多值字段。我想知道是否有一個現有的標記器/過濾器可以刪除空間。例如,給定「solr,apache solr,倒排索引」,我希望將它們作爲「solr,apachesolr,invertedindex」。Solr中的空間摺疊Tokenizer /濾波器
我在SOLR模式中有一個多值字段。我想知道是否有一個現有的標記器/過濾器可以刪除空間。例如,給定「solr,apache solr,倒排索引」,我希望將它們作爲「solr,apachesolr,invertedindex」。Solr中的空間摺疊Tokenizer /濾波器
在該字段的索引時間內,您可以使用PatternReplaceCharFilterFactory作爲分析器鏈中的第一個條目。因此,在您schema.xml中定義一個新的字段類型如下:
<fieldtype name="text_no_ws" class="solr.TextField">
<analyzer>
<charFilter class="solr.PatternReplaceCharFilterFactory"
pattern=" " replacement=""/>
...
,然後用其作爲類型的字段,如:
<field name="keywords" type="text_no_ws" multiValued="true" ... />