2011-06-25 76 views
0

是否可以使用正則表達式來捕獲整個短語以及短語連接的每個單詞?reg ex羣組和子羣組

所以對:

smith jones 

返回:

smith,jones,smithjones 

而且由於其他方面的限制(Solr的PatternTokenizer)我只能用一個分組。

回答

1

看起來你不需要額外的工作就可以做到這一點。與PatternTokenizerFactory,你被限制在正則表達式的「匹配」部分,所以你不能做替換。

爲什麼不創建自己的tokenizer,它使用PatternTokenizer創建的標記流,然後構建一個連接的字符串,並在最後返回?