2011-06-30 50 views
4

我想通過創建的XMLDocument這種方式打開一個HTML文件(從一個StreamReader檢索到的字符串,從網絡), :打開HTML文檔與xml.Load

XmlDocument doc = new XmlDocument 

doc.Load(string containing the retrieved document). 

但因爲HTML文件包含這個頭:

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd" > 

它告訴我,該文件是無效的...任何方法來解決這個問題?

回答

0

如果您肯定HTML是有效的XML,我想您可以簡單地用XML替換HTML頭。

+0

我不認爲你總是可以積極的... ... –

0

爲此,可以使用HTML Tidy Tidy.NET