我試圖從下面的字符串中提取http://xyz.com/5
鏈接。你可以看到只有那個我們有class="next"
屬性。所以我試圖根據這個屬性來獲取它。從HTML錨點提取特定值的正則表達式
<a href='http://xyz.com/1' class='page larger'>2</a>
<a href='http://xyz.com/2' class='page larger'>3</a>
<a href='http://xyz.com/3' class='page larger'>4</a>
<a href='http://xyz.com/4' class='page larger'>5</a>
<a href='http://xyz.com/5' class="next">»</a>
我嘗試了下面的模式,但是這會返回整個文本中的所有鏈接。
<a href='(.+?)' class="next">
(我從這個網站,使用正則表達式解析HTML是一個壞主意理解,但我必須現在做這個。)
你爲什麼「需要」? – TerryA
我同意你不應該使用正則表達式來解析HTML。然而,你的正則表達式適用於我(在多線模式下)。根據你如何運行這個,你可能不得不逃脫< >標誌。 –
@AndyG我也注意到了這一點。 http://regexr.com?35dan – TerryA