0
當我嘗試寫一個正則表達式匹配,是以鏈接的HREF爲第2組和錨標記文本組3的定位代碼:定期爲錨標記表達
<a(href=\"(\S+)\")?.*>([a-zA-Z0-9]+)<\/a>
到符合這樣的文字:
hello there <a href="Hello/world1">Hello World1</a><b>How are You<b><a href="Hello/world2">Hello World2</a>
但不是爲3組比賽Hello World1
它匹配Hello World2
。有人可以幫我寫一個正則表達式來匹配group2 = Hello/world1
和group2 = Hello World2
。 謝謝。
不要使用正則表達式來解析HTML,可能存在太多變化。使用DOM解析器庫。 – Barmar
是的,但我的任務是使用正則表達式來解決這個問題。 – mbhargav294
使用非貪婪的'。*?'代替'。*'。或者使用'[^>] *',這樣它就不會超過第一個'>'。 – Barmar