2010-09-08 152 views
0

可能重複:
RegEx match open tags except XHTML self-contained tags正則表達式解析HTML

我想,以確保在由XHTML要求HTML屬性都有他們周圍的報價。

例如:

<BODY link=#0000ff vLink=#800080> 

應該

<BODY link="#0000ff" vLink="#800080"> 

我尋找能處理這樣的正則表達式。

謝謝

+0

解析Html The Cthulhu Way,http://www.codinghorror.com/blog/2009/11/parsing-html-the-cthulhu-way.html – 2010-09-08 01:57:37

+2

本網站有100多個關於用正則表達式解析HTML的問題,所有這些都有相同的答案:甚至不打擾嘗試;它不起作用,不管你使用RE有多聰明,它仍然不起作用。 – 2010-09-08 02:14:24

+0

XHTML架構中的'body'元素全部小寫:http://www.w3.org/TR/xhtml1-schema/ XHTML是XML;如果驗證失敗,那就是垃圾。 – McDowell 2010-09-08 20:46:04

回答

2

雖然不是一個確切的副本,基本的答案是相同的。

你想要的不是正則表達式,而是一個DOM解析器。

請指定您的服務器端語言。或者你打算用JavaScript來做到這一點?如果是這樣,沒有多少意義。

一個建議也是,如果你這樣做使其XHTML有效,那麼你應該可能知道body元素(以及所有元素和屬性)以小寫形式使用。