2010-03-22 45 views
4

我正在使用html敏捷包來解析html 表格信息。現在有一些html內容缺少結束標籤,並且由於缺少結束標籤而來自這樣的頁面。html敏捷包不能正確解析信息。因此,我想在結尾標籤處插入缺少結束標籤,因此html敏捷包正確解析信息。所以要插入缺失的結束標籤,我該怎麼辦?我應該寫自己的代碼,還是使用html tidy pack來做那件事?哪一個是最好的HTML整潔包? HTML敏捷包中有沒有任何選項可以使HTML網頁整潔?

如果html tidy pack然後哪個是最好的html tidy pack,以及如何使用它的任何示例如果可能?如果我的自己的代碼比它可以像什麼?

在HTML敏捷包任何選項,它可以使我們能夠首先使HTML頁面整潔然後解析的網頁。

回答

6

在HTML敏捷性包我找不到,使HTML頁面tidy.There任何選項是插入缺失的結束標記一個選擇,但它的工作原理在HTML敏捷包一些HTML頁面only.That選項時,

HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument(); 
     doc.OptionFixNestedTags=true; 

我也嘗試了正則表達式,但它也適用於某些html頁面。

所以我找到了最好的HTML整潔包是:

http://www.devx.com/dotnet/Article/20505/1763/page/2.

我們可以看到有:如何導入的dll,以及如何使用它的整潔包,有示例代碼也可以。它是偉大的。它可以插入錯過結束標籤,並使您的HTML頁面整潔。

感謝您幫助大家..