我只是尋找一個非常簡單的方法來清理一些HTML(可能與嵌入的JavaScript代碼)。我試過twodifferentHTML Tidy .NET端口和兩個都拋出異常...C#版本的HTML Tidy?
對不起,「乾淨」我的意思是「縮進」。 HTML的格式不正常。這是嚴格的XHTML。
我終於得到的東西與SGML的工作,但是這是嚴重的代碼最可笑的大塊以往任何時候都縮進一些HTML。
private static string FormatHtml(string input)
{
var sgml = new SgmlReader {DocType = "HTML", InputStream = new StringReader(input)};
using (var sw = new StringWriter())
using (var xw = new XmlTextWriter(sw) { Indentation = 2, Formatting = Formatting.Indented })
{
sgml.Read();
while (!sgml.EOF)
xw.WriteNode(sgml, true);
}
return sw.ToString();
}
所以你只是想重新格式化你的源代碼?你可以使用任何web-ide或Notepad ++。 – 2010-10-23 03:59:10
@Nick:我意識到這一點,但我*不*嘗試重新格式化HTML文件我已經有..我想重新格式化HTML,我在C#應用程序中生成... – mpen 2010-10-23 04:14:20
檢查HtmlTextWriter,我更新了我的回答 – 2010-10-23 04:28:29