2012-08-17 54 views
2

我有很多txt文件,我需要替換它們上的一些文本。幾乎所有的人都有這non-ascii字符(我認爲這是"...",但是...是不一樣的) 我試過replace(),但我不能做到,我需要一些幫助!在此先感謝從字符串中刪除 xe2 x80 xa6 python

回答

2

使用unicode類型的字符串。例如,

>>> print u'\xe2'.replace(u'\xe2','a') 
a 
0

的問題是,這些字符不是有效的str ING,他們是unicode

import re 
re.sub(r'<string to repleace>','',text,re.U) 

大多數其他的答案將工作太