2
在Python文件,我碰到下面的代碼片段Python正則表達式用分割W¯¯
>>> re.split('\W+', 'Words, words, words.')
['Words', 'words', 'words', '']
>>> re.split('(\W+)', 'Words, words, words.')
['Words', ', ', 'words', ', ', 'words', '.', '']
我所困惑的是,\ W是不是一個Unicode字字符匹配任何字符,但」來了, '是Unicode字符。括號是什麼意思?我知道它匹配一個組,但模式中只有一個組。爲什麼','也是回報?
我明白了。所以逗號是一個Unicode字符,它不是一個單詞字符。謝謝! –