欲從包含HTML內容中,(<a>
和<span>
標記)的第一次出現之間的文本字符串中提取。正則表達式模式匹配
我的模式是如下:
$pattern='/<a[^(span)][\/\(\)-:@!%*>#=_|?$&";.\w\s]+<\/a> <span/um';
我得到的輸出爲<a
月1日發生的<span
末次出現和兩個第一次發生之間沒有文本之間的文本。
例如,HTML內容:
<a href="#">asdasdasd</a> <span blah blah></span> blah blah <a>blah </a> <span>blah
旺旺:
<a href="#">asdasdasd</a> <span
獲取:
<a href="#">asdasdasd</a> <span blah blah></span> blah blah <a>blah </a> <span
我知道這不會回答你的問題,我會建議不要使用正則表達式解析HTML。爲什麼不嘗試這樣的事情[DOM解析器(http://simplehtmldom.sourceforge.net/),並節省一些時間。 – noel
使用合適解析器。 –
知道DOM解析器,但使用正則表達式的原因必須在分配。學習正則表達式。 –