比方說,有兩個默認的HTML電子郵件標籤:正則表達式,以確保電子郵件地址
<a href="mailto:[email protected]">[email protected]</a>
<a href="mailto:[email protected]" nosecure>[email protected]</a>
我只想要查找的電子郵件標記沒有的nosecure
標籤在PHP。所以像\<a\b(?![^>]*\bnosecure\b)[^>]*>[^<]*<\/a>
這樣的東西到目前爲止將做到這一點。
但是現在我想爲href
標記的值和用於<a>...</a>
標記內的文本的值組設置一個組。第二組很容易:
\<a\b(?![^>]*\bnosecure\b)[^>]*>([^<]*)<\/a>
但是,如何獲得第一組?在href標記之前/之前可以有無限制的其他字符,而且nosecure可以在href標記之前/之前。
如何獲取href="mailto:<group>"
的值的正則表達式組。此外,可以有'
而不是"
。
測試用例和我目前的嘗試:https://regex101.com/r/RNEZO3/2
感謝所有幫助:)
問候
關於用正則表達式解析XML/HTML的困難的另一個問題......呃。 –