0
是否可以使用正則表達式來捕獲整個短語以及短語連接的每個單詞?reg ex羣組和子羣組
所以對:
smith jones
返回:
smith,jones,smithjones
而且由於其他方面的限制(Solr的PatternTokenizer)我只能用一個分組。
是否可以使用正則表達式來捕獲整個短語以及短語連接的每個單詞?reg ex羣組和子羣組
所以對:
smith jones
返回:
smith,jones,smithjones
而且由於其他方面的限制(Solr的PatternTokenizer)我只能用一個分組。
看起來你不需要額外的工作就可以做到這一點。與PatternTokenizerFactory,你被限制在正則表達式的「匹配」部分,所以你不能做替換。
爲什麼不創建自己的tokenizer,它使用PatternTokenizer創建的標記流,然後構建一個連接的字符串,並在最後返回?