我正在尋找preg_match_all模式來查找頁面上沒有結尾斜槓的所有網址。正則表達式的網址沒有結尾的斜槓,並排除某些文字的網址
例如:如果我有
a href="/testing/abc/">end with slash
a href="/testing/test/mnl">no ending slash
其結果將是2號。解決方法發佈在find pattern for url with no ending slash
我試圖修改提供的模式,以排除具有'圖像'或'.pdf'但沒有運氣的網址。
謝謝。
你已經嘗試過哪一個? – sp00m 2013-03-19 16:53:15
/href=(["])[^\s]+(? user2170712 2013-03-19 16:55:50
在使用任何正則表達式之前,請使用HTML解析器( DOMDocument)解析頁面,然後選出你想要處理的標籤並檢查href/src。 – nhahtdh 2013-03-19 17:06:39