2017-02-13 55 views
1

我們有一個應用程序,它可以令牌某些數據。我遇到的問題是我有一個逗號分隔的字段,我需要標記而不是空格。例如:Lucene Tokenizer - 包含空格

"Age 6, Age 7, Age 8" 

變爲

Age 
6 
Age 
7 
Age 
8 

我需要

Age 6 
Age 7 
Age 8 

有我的方式來改變只有某些字段的默認行爲?

的配置設置我目前:

<field fieldName="SizeGroup" storageType="YES" indexType="TOKENIZED" vectorType="NO" 
boost="1f" type="System.String" 
settingType="Sitecore.ContentSearch.LuceneProvider.LuceneSearchFieldConfiguration, 
Sitecore.ContentSearch.LuceneProvider" /> 
+0

您需要在您的字段中指定分析器:https://community.sitecore.net/technical_blogs/b/getting_to_know_sitecore/posts/understanding-analyzers-and-sitecore-7,並且可能需要編寫自定義分析器/標記生成器.. – Gatogordo

回答

0

不幸的是,我不知道C#,但我知道Lucene的。因此,對於需要的行爲,您需要使用PatternAnalyzer,它允許您指定將用於標記化的正則表達式。在你的情況下,像\\,這樣的模式應該適用於逗號分割。