2014-08-28 143 views
0

我有這種格式的文件:01,02,... 10,11,12,... 他們都是HTML,我試圖解析他們一點。 但是,當我試圖做到這一點,並保存文件,它確實發生,但沒有改變。python - 讀取文件,修改它並保存,但保存時不做任何修改。爲什麼?

from re import sub 
for i in range (0,10): 
    x = "0" 
    if i<10: 
     x="0"+str(i) 
    if i>10: 
     x=str(i) 
    print x 
    file = open(x+".html", "r") # opening file to read from 
    r = file.read() 
    file.close() 
    filew = open(x+".parsed", "w") # opening file to write in 
    r.replace('<br>', '/n') 
    r.replace('"', '/"') 
    sub('<[^<]*>', '', r) # delete all <tags> 
    sub('<\/[^<]*>', '', r) # delete all </tags> 
    filew.write(r) 
    filew.close() 

回答

0
r.replace('<br>', '/n') 
r.replace('"', '/"') 
sub('<[^<]*>', '', r) # delete all <tags> 
sub('<\/[^<]*>', '', r) # delete all </tags> 

這些線路沒有做任何事情。字符串是不可變的,所以函數不可能修改現有字符串的內容。相反,這些函數將返回一個全新的字符串,您必須將其分配給某個東西。

r = r.replace('<br>', '/n') 
r = r.replace('"', '/"') 
r = sub('<[^<]*>', '', r) # delete all <tags> 
r = sub('<\/[^<]*>', '', r) # delete all </tags>