1
A
回答
3
你可以使用
\w+
與Unicode的標誌。我假設你的名字沒有數字或下劃線的風險。
>>> re.findall('\w+', 'Márquez', re.U)
['Márquez']
也似乎問號後失蹤P
:(?P<name>[a-zA-Z]+)
0
對於Python < 3,你可能希望啓用區域:
import locale
locale.setlocale(locale.LC_ALL, '')
然後用re.LOCALE
選項會regexpes :
re.findall('\w+', 'Márquez', re.LOCALE)
雖然,大概Unicode是更好的路要走,但它需要的數據進行解碼和編碼它到你的本地編碼。
相關問題
- 1. 正則表達式字母數字字符串+特殊字母
- 2. 正則表達式字母數字和特殊字符的jQuery
- 3. 正則表達式的字母數字特殊字符
- 4. jQuery的字母數字(+特殊字符)正則表達式
- 5. 正則表達式特殊字符,數字和字母
- 6. 正則表達式與特殊字符
- 7. 大寫字母,2個特殊字符的正則表達式
- 8. 正則表達式4個字母的特殊字符
- 9. 正則表達式的特殊字符
- 10. 特殊字符的正則表達式?
- 11. 特殊字符的正則表達式
- 12. 正則表達式的特殊字符
- 13. 在正則表達式中匹配特殊字符和字母
- 14. 正則表達式與特殊字符
- 15. 正則表達式特殊字符
- 16. JavaScript特殊字符/正則表達式
- 17. C#正則表達式,特殊字符
- 18. 正則表達式與特殊字符
- 19. PHP正則表達式特殊字符
- 20. 正則表達式特殊字符
- 21. 正則表達式和特殊字符
- 22. 正則表達式Python字符串忽略特殊字符
- 23. 正則表達式來驗證字母數字和特定的特殊字符
- 24. 正則表達式接受字母或字母數字字符或帶有特殊符號的字母字符
- 25. Mysql正則表達式與一些特殊字符的字母數字
- 26. C#匹配字母,數字和特殊字符的正則表達式
- 27. 包含字母數字和特殊字符的正則表達式
- 28. 用於字母數字和特殊字符的正則表達式
- 29. 正則表達式的字母,至少1個數字和特殊字符
- 30. 驗證的正則表達式與字母數字和特殊字符
這並不好看的Python <3.0 - 我不喜歡使用與普通(非Unicode)字符串的UNICODE選項的想法。 – 2010-03-09 19:46:21
@Jacek:爲什麼你非ASCII字符串不是Unicode? – SilentGhost 2010-03-09 19:48:30
在Python 2.x的STR型和「XXXX」文字只包含一個字節的字符串。這些字節可能是特定編碼中的某些字符,但是沒有編碼信息,這些字符只是字節。 '馬爾克斯' 是:(77,195,161,114,113,117,101,122)(8個字節),如果您的編碼是 'UTF-8' 或(77,225,114,113,117,101,122 )(7字節)如果編碼是ISO 8859-1。當在ISO 8859-7中解碼時,相同的值將是「Mαrquez」。相同的字節,不同的字符。不知道編碼,我們不能談論Unicode字符。 – 2010-03-09 20:30:47