1
給定一個字符串,如何提取的所有序列正好是的4位數字?提取年份的正則表達式
也就是說,對於1234 12 12345 1bc5 9876
我想要得到[1234, 9876]
。
我得到了儘可能多的re.findall('\D\d\d\d\d\D')
,但是在文本邊界上失敗(當匹配之前/之後沒有字符時)。
解決方案最好使用Python 2.7,但我想這是相當普遍的,任何語言都可以。
給定一個字符串,如何提取的所有序列正好是的4位數字?提取年份的正則表達式
也就是說,對於1234 12 12345 1bc5 9876
我想要得到[1234, 9876]
。
我得到了儘可能多的re.findall('\D\d\d\d\d\D')
,但是在文本邊界上失敗(當匹配之前/之後沒有字符時)。
解決方案最好使用Python 2.7,但我想這是相當普遍的,任何語言都可以。
一般的答案是驚人的複雜,更多信息請參閱here。然而,在這種特殊情況下,我們可以簡單地使用單詞邊界斷言\b
:
re.findall(r'\b\d{4}\b', ....)