我寫了一個程序來讀取Windows DNS調試日誌,但裏面總是有一些有趣的字符域字段。python替換Unicode字符
下面是例子之一:
(13)\xc2\xb5\xc2\xb1\xc2\xbe\xc3\xa2p\xc3\xb4\xc2\x8d(5)example(3)com(0)'
我要全部更換爲\x..
與?
我明確地鍵入\ XC2如下作品
line = '(13)\xc2\xb5\xc2\xb1\xc2\xbe\xc3\xa2p\xc3\xb4\xc2\x8d(5)example(3)com(0)'
re.sub('\\\xc2', '?', line)
result: '(13)?\xb5?\xb1?\xbe\xc3\xa2p\xc3\xb4?\x8d(5)example(3)com(0)'
但它不是如果我寫作如下:
re.sub('\\\x..', '?', line)
如何寫一個正則表達式來替換它們?
純粹作爲讀者的exersize - 're.sub('[\ x80- \ xff]','?',line)'。但請不要那麼做,@ wim的答案就是你應該去做的。 –