我想剝奪標點符號的字符串,我結束了使用澄清的re.findall()方法在python
re.findall(r"[\w]+|[^\s\w]", text)
它工作正常,它並解決我的問題。我不明白的是括號內的細節和整個模式的事情。 r"[\w]+|[^\s\w]"
究竟意味着什麼?我看着它在Python標準庫和它說:
re.findall(pattern, string, flags=0)
返回所有非重疊的字符串模式的匹配,作爲 字符串列表。字符串從左到右掃描,匹配返回 找到的順序。如果該模式中存在一個或多個組,則 會返回組列表;如果模式 有多個組,這將是元組列表。空結果包含在結果 中,除非它們觸及另一場比賽的開始。
我不知道我是否得到這個,澄清對我來說有點模糊。任何人都可以請告訴我在這種情況下的模式意味着什麼,以及它在findall()方法中的定義是什麼?
你想了解[regex](http://docs.python.org/3/howto/regex.html) – JBernardo