我需要用波蘭語字符替換字符串。使用波蘭語字符時的不兼容
我嘗試下面的代碼:
k = 'aąkkk cdkkk aą xskkk'
odp = re.sub('(?<!aą|cd)kkk', '***', k)
print (odp)
但不幸的是它產生以下錯誤:因爲當我更換了與「A」字
File "/usr/lib/python2.7/re.py", line 244, in _compile raise error, v # invalid expression
問題是與潤色人物 'a'char它工作正常:
k = 'aąkkk cdkkk aą xskkk'
odp = re.sub('(?<!aa|cd)kkk', '***', k)
print (odp)
答案是:aą*** cdkkk aą xs***
我嘗試使用UNICODE,但它仍然不能正常工作:
a = re.compile(ur'(?<!\u0061\u0105|\u0063\u0064)kkk', re.UNICODE)
a
k = u'aąkkk cdkkk aą xskkk'
odp = a.sub('***', k)
print (odp)
答案上面是:aÄ*** cdkkk aÄ xs***
我怎樣才能解決這個問題?
你是否在腳本的開頭設置了'coding:'?結果看起來像您需要在您的終端中啓用UTF-8支持。 – tripleee