我有一些HTML代碼中有很多行的,我想刪除這個樣子從HTML代碼
<span style="position:absolute; border: black 1px solid; left:94px; top:600px; width:6px; height:10px;"></span>
現在也有跨度,在它們之間具有文字標籤過濾掉空標籤我想保持。
我想使用python re.sub函數刪除那些無用的span標籤。我寫這個,但它不工作
html_code_filtered = re.sub('<span*></span>', '', html_code)
我想我錯過正則表達式上的東西匹配正確的行嗎?
使用beautifullsoup如果可能的話這種問題請參見http:// WWW .crummy.com/software/BeautifulSoup/ – maazza
當span標籤僅包含一個img標籤時會發生什麼? –
@CasimiretHippolyte在這種情況下,它不會被刪除,但我不必處理這樣的事情,因爲這不會發生在我正在處理的html文件中。 – Atirag