2015-10-26 113 views
-1

從替換HTML文件子標籤我有一個字符串象下面這樣:別的東西

string = "<sub>1</sub>" 

我想標籤子改變這樣的事情:

"<sub>1</sub>" -> "-sub--1--sub-" 

我已經試過這樣:

string1 = re.sub('<sub.*>','-sub--',string) 
string1 = re.sub('</sub>','--sub-',string) 

但它不起作用。

回答

2
re.sub(r"<([^>]*)>([^<]*)<\/([^>]*)>", r"-\1--\2--\3-", string) 
0

您使用了貪心操作.*,其中非貪婪操作.*?會更好地工作。此外,您的第二個更改會覆蓋您的第一個更改。 試試這個:

string1 = re.sub('<sub.*?>','-sub--',string) 
string1 = re.sub('</sub>','--sub-',string1) 

但是,你應該avoid using regex to parse XML。改爲使用XML解析器。