我試圖找出如何通過<p>TEXT</p>
標籤,以取代所有<a href....>TEXT</a>
標籤。如何通過替換另一個類型的標籤(<a ...>..</a> =><p>..</p>)
我已經開始尋找<a href...>
和</a>
的模式,因此我可以相應地替換它們。不幸的是,它似乎不匹配最接近的字符串。
>>> s = '<td class="tt"><a href="#">Alert types</a></td> <td class="info">Vibration</td> </tr><tr><td class="tt"><a href="#">Sound</a>'
>>> re.sub('<a h.*>','<p>',s)
回報
'<td class="tt"><p>'
代替:
'<td class="tt"><p>Alert types</a></td> <td class="info">Vibration</td> </tr><tr><td class="tt"><p>Sound</a>'
你知道如何使它匹配.*
之間的最近字符串?
您正則表達式有'H *'所以任何東西,嘗試'] *>' – depperm
使用HTML解析器和串行像[LXML(HTTP:/ /lxml.de/lxmlhtml.html#examples)。 – Ryan
你真的想[使用正則表達式來解析HTML?](http://stackoverflow.com/a/1732454/6499571) –