我需要的是非常簡單的。如果鏈接或單詞爲空或空白,則不匹配。正則表達式匹配不是空的HTML鏈接?
<a href="link">anything</a> - match
<a href="">anything</a> - not match
<a href="link"></a> - not match
<a href=" ">anything</a> - not match
<a href="link"> </a> - not match
<a href=" "> </a> - not match
<a href=""> </a> - not match
<a href=" "></a> - not match
<a href=""></a> - not match
我先試了一下;
<a href="(.*?)">(.*?)</a>
我知道^a
意味着不是一個。但只有^
無效。那麼什麼語法意味着不是空的?
注意:我知道a
標記中可以有其他屬性。
爲什麼不使用正確的HTML解析器而不是正則表達式? –
您可以通過檢查非空白字符的_presence_來檢查鏈接或單詞是空還是空白。無論如何,建議您參考DOM來確定html節點內容。 – MikeM