我使用re.split()
將字符串分隔爲標記。目前我用作參數的模式是[^\dA-Za-z]
,它從字符串中檢索字母數字標記。Python中的單獨數字/字母標記
但是,我需要的是還將具有數字和字母的標記分爲僅具有一個或另一個標記的標記,例如。
re.split(pattern, "my t0kens")
將返回["my", "t", "0", "kens"]
。
我猜我可能需要使用lookahead/lookbehind,但我不確定這是否真的有必要或者是否有更好的方法來做到這一點。
,你可以在你的兩個建議結合擠:'打印re.findall( '[A-ZA-Z] + | \\ d +',「我的t0kens「)',它返回:'['my','t','0','kens']' –
@Bart - 是的,這樣好多了! – kjp
隨着巴特的編輯,這肯定比我的答案更好。 +1 –