2
我試圖做到這一點找到替換非拉丁字所有!。蟒蛇在字符串與正則表達式
是否有可能找到用非正則表達式在非拉丁文本中替換非拉丁文字(整個單詞)? 如何?
編輯:
如果你想測試嘗試這些字符串:
>>> u_word = u'αβ'
>>> u_text = u'αβγ αβ αβγδ δαβ'
>>> new_word = u'χχ'
>>> val = re.sub(r'\b' + u_word +r'\b', unicode(new_word), u_text)
>>> val
u'\u03b1\u03b2\u03b3 \u03b1\u03b2 \u03b1\u03b2\u03b3\u03b4 \u03b4\u03b1\u03b2'
>>> u_text
u'\u03b1\u03b2\u03b3 \u03b1\u03b2 \u03b1\u03b2\u03b3\u03b4 \u03b4\u03b1\u03b2'
>>>
你介意加入u_word和new_word能夠測試 – locojay
第二'\ B'必須在原始字符串......否則,它會解釋爲'\ x08' – JBernardo