2013-04-17 213 views
-1

我解析了我網站上的各種html頁面。我想刪除一些特定的'a'標籤。 全部標籤是這樣的:從html中刪除特定的標籤

<a href="#cite-note-2"><span>..</span></a> 
<a href="#cite-sub">....</a> 

所以我想是去除所有標籤一個在HREF與#cite

開始請建議一些正則表達式在PHP。感謝

+0

沒有。在HTML上使用正則表達式,特別是操縱,是一個壞主意。改爲使用[DOM](http://php.net/dom)。 –

+0

正則表達式通常適用於從包含尖括號的文本中提取(而不是解析)。然而,他們不適合新人。如果你不知道正則表達式,你不應該嘗試它。此外,不要要求互聯網提供魔術黑盒子代碼。 - 更簡單的解決方案是phpQuery或QueryPath;但是,是的,你仍然需要一些研究。 – mario

回答

0

試試這個正則表達式:

'/<a[\s]{1,}href=[\'"]\#cite.*?[\'"].*?>.*?<\/a>/ims'

例如:

$a = preg_replace('/<a[\s]{1,}href=[\'"]\#cite.*?[\'"].*?>.*?<\/a>/ims', '', $a);

+0

感謝一噸。此外,你可以鏈接我到一個可靠的網頁,我可以學習如何建立自定義RegEx? –

+0

嗯。我收到了一些您可能感興趣的文檔。在我的臨時電子郵件地址[email protected]發郵件給我。我會回覆文件。 –