2011-06-10 59 views
0

嗯,我總是有很多貧困與正則表達式或正則表達式,所以我要求幫助。PHP乾淨的HTML正則表達式

我試圖探索瀏覽器的HTML編輯功能,但大多數時候,我得到的東西我不需要,像這樣的

<div style="text-align: left;"><span style="font-size: small;"><font face="verdana"><br></font></span></div> 

有人能這麼漂亮給我提供一個正則表達式把它變成只有<br>

理想的交易是如果可能有一個處理不同的組合像字體的臉可能不是verdana和文本對齊的風格可能是每個示例的中心。

在此先感謝。

Pluda

+4

不要使用正則表達式來解析HTML。這是一個非常好的帖子,關於如何正確地做到這一點:http://stackoverflow.com/questions/3650125/how-to-parse-html-with-php – Cfreak 2011-06-10 16:28:56

+0

你如何決定你想保留什麼,以及你想要什麼剝離?我在這裏看到的唯一真實的事情是''已被棄用,不應該在你的html中。 – bdares 2011-06-10 16:29:04

+0

如果你真的想明白你爲什麼不應該嘗試用正則表達式解析(x)html:http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained - 標記 – afarazit 2011-06-10 16:55:23

回答

1

正則表達式是不正確的路徑,由於其解析HTML限制。

我認爲你最好看看strip_tags()。特別使用第二個參數標籤允許。但是,確定要移除和保留哪些標籤可能會很困難。如果情況確實如此,您可能需要更新您的問題。

0

如果你想用一個簡單的br標籤去除固定的HTML湯的積累,那麼正則表達式可能是可行的。然而,我沒有看到這裏的困難。您的字符串本身不包含元字符。因此,您只需要用\w+[\w\s]+等佔位符替換leftVerdana,並將所有內容都放入分隔符中,如#

+0

我想我會去第一個答案的鏈接,但是,請你給我一個例子嗎?真的,我不知道如何應用這個\ w \ s。謝謝 – Pluda 2011-06-10 16:58:40