我解析的HTML文件包含一些ASCII控制代碼。我注意到,PHP的DOM文檔分析器截斷時,發現在節點內ASCII控制字符的文本節點,如如何讓DOMDocument對ASCII控制字符更好?
Device Control 0x13
End of Medium 0x19
File Separator 0x1C
Group Separator 0x1D
是這是一個錯誤還是一個功能?有什麼辦法讓DOMDocument採取其他行動嗎?我在DOM處理之前使用了這些字符,但我想知道這是否是正確的解決方案。
我看到你接受我的回答,是你可以配置解析器作爲1.1?或者你是否使用了前置1.1序言的解決方法?或者有些不同?如果您可以顯示一些示例代碼,那麼對於有相同問題的其他人也會有所幫助。 – kdgregory 2010-01-04 19:41:16