2012-06-06 67 views
0

大家好,我設置了一個挑戰,在那裏我必須通過HTML頁面解析以找到所有類的結束日期。我正在使用HTMLAgilityPack,但是,這是我第一次使用它,也沒有設置它的網頁沒有類或Id,並且結束日期存儲在Tr H4標記中。我不知道如何通過任何命中解析?解析HTML標籤以查找特定的表格行

我的代碼:

HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument(); 
doc.Load(txtURL.Text); 

sw.WriteLine("GET /academics/academic-calendar/ HTTP/1.1"); 
sw.WriteLine(); 
String response = sr.ReadToEnd(); 

txtHTML.Text = response; 

回答

1

HtmlDocument對象可以查詢 - 您可以使用XPath發現,遵循特定的路徑,或者其他約束的所有元素,你也可以使用LINQ查詢。

我建議下載源碼包 - 它帶有許多使用示例的項目。

+0

你有鏈接可直接下載嗎? – moutonc

+0

@moutonc - 真的嗎?這對你來說是個問題? http://htmlagilitypack.codeplex.com/downloads/get/120937 – Oded

+0

是的對不起,我的Google技巧,我忘了我有這只是我需要看看謝謝! +1 +回答 – moutonc

1

使用XPath可以讓你得到你所需要的。 下面是如何從聲明的html中獲取所有錶行的示例。

HtmlDocument htmlDocument = Markup.Parser();         
htmlDocument.LoadHtml(html); 
htmlDocument.DocumentNode.SelectNodes("/tr"); 
+0

不錯,不應該只是這麼簡單嗎? – LoneXcoder