-1
逃脫HTML標籤我有這樣子:正則表達式包括與其他正則表達式
<a href="http://www.somesite.com/" target="_blank">
而且已經挖出了這個互聯網上的正則表達式,以確定該字符串的URL部分。
\ b(https?| ftp | file):// [-A-Z0-9 + & @#/%?=〜_ |!:,。;] * [ - A-Z0-9 + & @#/%=〜_ |]
然而,這正則表達式是不包括封閉的轉義HTML文本<a href="
和" target="_blank">
。
我需要能夠識別大文檔中的完整字符串,並且包括爲上述字符串的非轉義HTML部分組成額外的正則表達式。正則表達式爲了找到上面的字符串會是什麼樣子?
謝謝!
[你不應該試圖解析與正則表達式HTML(HTTP:// stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1732454#1732454) – Bohemian