我想從字符串中除去某些指定的html標籤。 如果我打電話用默認值都構造正常工作:Strip html標籤 - lxml.html.clean.clean_html無法按預期方式工作
>>> cleaner = lxml.html.clean.Cleaner()
>>> cleaner.clean_html('''<i>italic</i><script>alert('');</script>''')
'<span><i>italic</i></span>'
但是,當我嘗試指定一些標記,東西不工作了:
>>> allowed_tags = ['i','s']
>>> cleaner = lxml.html.clean.Cleaner(remove_unknown_tags=False,allow_tags=allowed_tags)
>>> cleaner.clean_html('''<i>italic</i><s>strike</s>''')
'<span></span>'
那我做錯了什麼?