我想是這樣[A-z]
計數的所有字母加東西,如ö
,ä
,ü
等正則表達式獲取所有字母
如果我做[A-ü]
我得到可能拉丁語言所使用的所有特殊字符,但它也允許其他的東西一樣¿¿]|{}[¢§ø欰µ©¥
實施例:https://regex101.com/r/tN9gA5/2
編輯: 我需要python2中的這個。
我想是這樣[A-z]
計數的所有字母加東西,如ö
,ä
,ü
等正則表達式獲取所有字母
如果我做[A-ü]
我得到可能拉丁語言所使用的所有特殊字符,但它也允許其他的東西一樣¿¿]|{}[¢§ø欰µ©¥
實施例:https://regex101.com/r/tN9gA5/2
編輯: 我需要python2中的這個。
當您使用[A-z]
時,您不僅可以捕獲從「A」到「z」的字母,還可以捕獲更多非字母字符:[ \ ]^_ `
。
在Python中,可以使用[^\W\d_]
和re.U
選項來匹配Unicode字符(請參閱this post)。
Here is a sample根據您的輸入字符串。
Python的例子:
import re
r = re.search(
r'(?P<unicode_word>[^\W\d_]*)',
u'TestöäüéàèÉÀÈéàè',
re.U
)
print r.group('unicode_word')
>>> TestöäüéàèÉÀÈéàè
這可能是最好的想法,但我使用Python和標準的正則表達式庫不支持這一點。 – yamm