我一直在使用WebBrowser.Document獲得某些元素,如id,標記或div ......但似乎WebBrowser似乎太慢,無法處理許多URL地址...任何理念?可能的方法來獲取頁面源代碼或標記名稱
1
A
回答
0
0
我一直在使用WebBrowser.Document獲得某些元素,例如ID,標籤,或div。
從您的問題的標題和內容,它不清楚從這個聲明,你需要使用獲取,分析和呈現HTML的控制。
聽起來像你只是爲了得到和解析你的HTML。如果這是真的,你應該使用Html Agility Pack。 HAP可以從URL獲取HTML,然後解析它。然後您可以使用linq或XPath或遍歷方法來獲取您的標籤和div。
有很多關於如何使用hap的文章,比如這個包含示例和鏈接的How to use HTML Agility pack。
一個the links包括此例如通過法魯克凱澤它得到一個文檔中的所有鏈接,並在使用WebBrowser控件我把它添加到列表`」
HtmlDocument doc = new HtmlDocument();
doc.Load(url);
HtmlNode root = doc.DocumentNode;
List<string> anchorTags = new List<string>();
foreach (HtmlNode link in root.SelectNodes("//a"))
{
string att = link.OuterHtml;
anchorTags.Add(att);
}
相關問題
- 1. 獲取頁面源代碼
- 2. 獲取頁面源代碼
- 3. 獲取頁面源代碼的問題
- 4. 在我的代碼中獲取目標名稱(或圖標名稱)
- 5. 如何使用httpClient編碼gzip來獲取頁面源代碼?
- 6. 在記事本中獲取頁面的生成源代碼
- 7. 獲取頁面源代碼擴展
- 8. 無法獲取網頁的源代碼
- 9. 無法獲取文檔頁面名稱
- 10. 獲取父頁面名稱
- 11. 在MediaWiki中從URL編碼的頁面名稱獲取頁面名稱
- 12. 以編程方式獲取MediaWiki頁面的源代碼
- 13. 獲取網頁源代碼
- 14. 如何使用php代碼獲取html頁面的頁面源代碼?
- 15. 匿名方法源代碼
- 16. 在使用jQuery獲取頁面後,通過標記名稱獲取元素$ .get
- 17. 從特定頁面獲取父頁面標題名稱ID號
- 18. 如何從asp.net獲取當前頁面源代碼頁面
- 19. 如何獲取標記的名稱或標識JVectorMap
- 20. 是否有可能以編程方式獲取生成的網頁源代碼?
- 21. Python的反思 - 我可以用它來獲取方法定義的源代碼
- 22. 無法使用ruby獲取頁面源代碼
- 23. 如何通過使用硒來運行firefox來獲取頁面的源代碼?
- 24. 如何獲取網頁的網站名稱和頁面標題
- 25. 可能顯示代碼頁面上代碼隱藏的實際源代碼
- 26. ServletRequest獲取實際頁面的名稱
- 27. 通過PHP獲取頁面的名稱?
- 28. 我可以通過提供方法本身來獲取方法的名稱嗎?
- 29. 獲取頁面標題在主頁面代碼
- 30. 是否有可能獲得createTextNode方法來呈現html標記?
這裏.. 公共無效的getLocation(字符串URI,串id) { WebBrowser wb = new WebBrowser(); wb.Url = new Uri(uri) string s; HtmlElement tableElem = wb.Document.GetElementById(id); s = tableElem.tableElem.GetAttribute(「src」); messagebox.show(s); } 我不得不等待秒秒,讓我的瀏覽器加載的網址,但然後顯示消息回合ActiveX控件等等。 回合HAP,我仍然得到問題,以獲得值 HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument(); doc.load(uri); s = doc.getelementbyid(id).getatributevalue(「src」,「null」); 但仍然無法正常工作 –