我有情況,我已經下面的內容是這樣正則表達式來刪除外部鏈接與出文字
This is a <a href="https://www.test.com">test1</a>. This is <a href="/node/1">test2</a>. This is <a href="https://nct.com">test3</a>. This is a <a href="www.test.com">test4</a>. This is a <a href="http://test.com">test5</a>.
nct.com是我的網站。我不想刪除包含在標籤內的鏈接和文本。那麼/ node/1。
我期待的輸出是
This is a test1. This is <a href="/node/1">test2</a>. This is <a href="https://nct.com">test3</a>. This is a test4. This is a test5.
凡爲外部網站如test.com,我想一個標籤內容不去除包裝標籤中的文本。我使用
釷正則表達式是
#<a [^>]*\bhref=(['"])http.?://((?<!mywebsite)[^'"])+\1 *.*?</a>#i
這將刪除標記內容以及在標籤中的文本。
你需要nct.com和/ node/1在正則表達式中硬編碼還是隻有url沒有http(s)? – Wouter