0
取下字符串只錨標籤我知道,從字符串中刪除所有的HTML標籤可以使用:用正則表達式
string = re.sub('<[^<]*?/?>', '', string)
但反正是有,我只能刪除錨標記,並保持所有其他標記。因此,例如:
<p>Some text<a href="#">link</a></p>
成爲:
<p>Some text link</p>
取下字符串只錨標籤我知道,從字符串中刪除所有的HTML標籤可以使用:用正則表達式
string = re.sub('<[^<]*?/?>', '', string)
但反正是有,我只能刪除錨標記,並保持所有其他標記。因此,例如:
<p>Some text<a href="#">link</a></p>
成爲:
<p>Some text link</p>
感謝REVO它完美地工作。 我也使用管理的regex
string = re.sub('<a.*?>|</a> ', '', string)
[不使用正則表達式來解析HTML(http://stackoverflow.com/a/1732454/560648)來解決這個問題。 –
沒有可靠的方法來使用正則表達式來做到這一點。相反,請使用xml解析器,例如beautifulsoup。 –
你可以使用它「(\ b <.+> \ w + <\/.*?>)(?= \ <\ /)」(刪除引號)=>只針對單行。 –