2017-06-22 28 views
0

這裏閱讀從原始的HTML所有錨標籤是我的html字符串如何使用htmlagilitypack

string htmlData="<!DOCTYPE html><html><Head></Head><body>&lt;div&gt;&lt;a target=\"_blank\" href=\"http://blender.palmbeachschools.org/GetFile.aspx?f=e9bf5637-c5bd-d4ba-3a1e-cf35ecfcad13\" style=\"font-family: Arial, Helvetica, sans-serif; font-size: large;\"&gt;Breakdown of Standards by Unit &lt;/a&gt;&lt;span style=\"font-size: large; font-family: Arial, Helvetica, sans-serif;\"&gt;&lt;br&gt;&lt;/span&gt;&lt;br&gt;&lt;br&gt;&lt;br&gt;&lt;/div&gt;</body></html>" 

我要讀從這個網站的所有錨標籤。這裏的挑戰是所有的錨點標籤都沒有被解析。

我嘗試使用

HtmlDocument doc = new HtmlDocument();   
doc.LoadHtml(htmltemp); 
var pre = doc.DocumentNode.Descendants("a").FirstOrDefault(); 

這回我空。

回答

0
 string htmlData = "<a href='1'>First</a><ul><li><a href='1'>Second</a></li><li><a href='1'>Third</a></li></ul>"; 
     HtmlDocument doc = new HtmlDocument(); 

     doc.LoadHtml(htmlData); 
     var anchorTags = doc.DocumentNode.Descendants("a"); 

您可以使用此代碼。