2013-02-27 53 views
1

我必須處理密集格式化的HTML中存在的問題,這些問題實際上是無法讀取的,所以我希望圖書館能夠「漂亮地打印」,格式化,美化等等你想在管理這個HTML的.NET應用程序中調用它。尋找一個離線庫來格式化HTML,我可以使用.NET代碼

目前,我將其複製並粘貼到Visual Studio 2012中,並將其格式化,然後將其粘貼迴應用程序,但這變得有點乏味。

如果能夠在解決問題時有效地逆轉過程並去掉所有的空白區域,它也會很方便。

順便說一句,我知道改變HTML格式有時會導致意想不到的結果(我在看你IE),但我可以忍受。

+0

使用IDE他們有格式化功能,您可以在其中格式化整個文檔或指定的選擇。 – MethodMan 2013-02-27 19:47:31

+0

@DJKRAZE:OP使用IDE,但它是手動的,需要自動執行此過程。 – 2013-02-27 19:50:22

+0

不要關閉!這是一個很好的問題! – nalply 2013-02-27 20:25:18

回答

5

退房Html Tidy for .NET/Mono

從項目頁面:

TidyManaged

這是一個託管的.NET /單聲道包裝領域的開源,跨平臺的整理圖書館,HTML/XHTML/XML標記分析器&清潔器最初由Dave Raggett創建。

而且樣品用量:

using System; 
using TidyManaged; 

public class Test 
{ 
    public static void Main(string[] args) 
    { 
    using (Document doc = Document.FromString("<hTml><title>test</tootle><body>asd</body>")) 
    { 
     doc.ShowWarnings = false; 
     doc.Quiet = true; 
     doc.OutputXhtml = true; 
     doc.CleanAndRepair(); 
     string parsed = doc.Save(); 
     Console.WriteLine(parsed); 
    } 
    } 
} 

看起來它應該滿足您的需求完美。

+0

我有這樣的感覺,但在VS2012解決方案中引用DLL(我認爲是COM組件)時遇到了問題。即使如此,我真的想要託管代碼解決方案。 – CrispinH 2013-02-28 08:43:37

相關問題