我有一個代碼,下面這條所有標籤:如何去除re.compile python中除了br之外的所有標籤?
import re
def cleanhtml(raw_html):
cleanr = re.compile('<.*?>')
cleantext = re.sub(cleanr, '', raw_html)
return cleantext
payload = '<a href="asdasda.htm">I am inside</a><br/><p>Tagsssss</p>'
print cleanhtml(payload)
如何忽略<br>
標籤,只是刪除所有其他標籤?此代碼將所有行附加在一起。
按'<(?!br\b).*?>' – revo