在這個HTML代碼:正則表達式:如何找到在HTML屬性,包括另一屬性
<frameset border="0" framespacing="0" frameborder="0" rows="85,*">
<frame border="0" marginheight="0" name="logoframe" scrolling="no" noresize target="middle" src="a.html" onload="reload()">
<frameset cols="235,*">
<frame border="0" name="left" src="b.html" scrolling="no"><frame border="0" noresize name="main" src="c.html" scrolling="auto"></frameset><noframes>
<body topmargin="0" leftmargin="0">
<p>This page uses frames, but your browser doesn't support them.</p></body>
</noframes>
</frameset></html>
我想找到src
屬性包含在這個例子中,它應該返回c.html
name="main"
。
*不*用正則表達式解析HTML。認真。 –
與beautifulsoup的解決方案將是不錯 – azDev
更多選項:https://duckduckgo.com/?q=python+dom+parser – jkdev