我想構建一個正則表達式,以從內容中刪除鏈接,除非它包含2個條件中的1個。正向表達式與負面展望
<a.*?href=[""'](http[s]?:\/\/(.*?)\.link\.com)?\/(?!m\/).*?<\/a>
這將匹配link.com的任何鏈接,該鏈接在域部分末尾沒有m /。我想所以簡化版,網址相匹配的是鏈接到PDF文件,無論以m/url中的稍微改變這一點,我想出了:
<a.*?href=["'](http[s]?:\/\/(.*?)\.brodies\.com)?\/(?!m\/).*?\.(?!pdf)["'].*?<\/a>
這是戶外等都非常接近,除了現在只有當URL有「。」時纔會匹配。最後 - 我可以看到它爲什麼這樣做。我似乎無法制作「。」可選的,因爲這會導致「。」之前的非貪婪模式。繼續下去,直至碰到[「']
任何幫助將是一件好事,以幫助解決這個問題。
感謝 保羅
謝謝,一個非常全面的表達,是的,它可能不夠好,但我認爲這是野獸的本質。我構建的表達式足以匹配所使用的鏈接,除了pdf鏈接。謝謝你,我會放棄它。 –