可能的方法來獲取頁面源代碼或標記名稱

我一直在使用WebBrowser.Document獲得某些元素，如id，標記或div ......但似乎WebBrowser似乎太慢，無法處理許多URL地址...任何理念？可能的方法來獲取頁面源代碼或標記名稱

來源

2012-05-11 Kiri十

你可以嘗試，包括一些開源的瀏覽器，包括他們在代碼

http://duckwebbrowser.codeplex.com/

http://xplora.codeplex.com/

來源

2012-05-11 11:40:19

我一直在使用WebBrowser.Document獲得某些元素，例如ID，標籤，或div。

從您的問題的標題和內容，它不清楚從這個聲明，你需要使用獲取，分析和呈現HTML的控制。

聽起來像你只是爲了得到和解析你的HTML。如果這是真的，你應該使用Html Agility Pack。 HAP可以從URL獲取HTML，然後解析它。然後您可以使用linq或XPath或遍歷方法來獲取您的標籤和div。

有很多關於如何使用hap的文章，比如這個包含示例和鏈接的How to use HTML Agility pack。

一個the links包括此例如通過法魯克凱澤它得到一個文檔中的所有鏈接，並在使用WebBrowser控件我把它添加到列表`」

HtmlDocument doc = new HtmlDocument(); 
doc.Load(url); 
HtmlNode root = doc.DocumentNode; 

List<string> anchorTags = new List<string>(); 

foreach (HtmlNode link in root.SelectNodes("//a")) 
{ 
    string att = link.OuterHtml; 
    anchorTags.Add(att); 
}

來源

2012-05-11 16:12:20

這裏.. 公共無效的getLocation（字符串URI，串id） { WebBrowser wb = new WebBrowser（）; wb.Url = new Uri（uri） string s; HtmlElement tableElem = wb.Document.GetElementById（id）; s = tableElem.tableElem.GetAttribute（「src」）; messagebox.show（s）; } 我不得不等待秒秒，讓我的瀏覽器加載的網址，但然後顯示消息回合ActiveX控件等等。回合HAP，我仍然得到問題，以獲得值 HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument（）; doc.load（uri）; s = doc.getelementbyid（id）.getatributevalue（「src」，「null」）; 但仍然無法正常工作 –

可能的方法來獲取頁面源代碼或標記名稱

回答

相關問題