2010-10-08 38 views
0

我已盡全力通過研究來自己回答這個問題,但我仍然有點擔心我是否使用正確的東西。 基本上我正在使用DomDocument庫爲我的框架構建一個類似jQuery的主題解析器。現在,網絡就像今天一樣HTML的形式和大小不同,例如HTML 4,HTML 5,XHTML,XHTML 5等...... 我用DomDocument發現的問題是如果你給它HTML代碼,它會只有符合標準的XHTML才能使用它。 我知道它可以將它轉換爲XHTML,我可以使用整潔的庫來使代碼可以接受,但是我主要擔心的是:如果使用我的框架的開發人員使用所有酷(有爭議的)新HTML 5功能的主題,只要他把它傳遞給我的框架,它就會引發發脾氣或將其轉換爲XHTML,這將吸引。我是否應該使用DomDocument解析HTML代碼

所以我的問題是: DomDocument是我需要的最方便的庫嗎?

有沒有得到它與HTML的所有變種的不同的工作方式?

回答

1

DOMDocument可以解析非XHTML文件。只需設置適當的開關:

libxml_use_internal_errors (true); 

    $dom = new DOMDocument; 
    $dom -> formatOutput = true; 
    $dom -> substituteEntities = false; 
    $dom -> recover = true; 
    $dom -> strictErrorChecking = false; 
+0

嗯,我給一個嘗試 – 2010-10-08 07:35:10