2012-07-23 40 views
0

可能重複顯示的數據:
What is the best way to parse html in C#?讀取數據,解析並在textviews

我試圖寫它使用的HttpWebRequest用GET方法的一些代碼(或任何建議使用更快的功能),在頁面上找到關鍵詞,然後在各種文字瀏覽中顯示它後面的內容。

它查找將永遠是相同的,總能找到相同的路線,但用不同的數據的網頁。

我讀過關於所謂HtmlAgilityPack了很多,但我想不通,如果我可以用它來的,也不怎麼樣。

有沒有更快的功能使用先手和源中查找數據?
我可以使用HtmlAgilityPack,如果又如何(例如請)?
有沒有更簡單的方法可以做到這一點?

歡呼
氮氧化物

+0

大概**的SO關於C#最**問的問題。 [什麼是C#來解析HTML的最佳方式?(http://stackoverflow.com/questions/56107/what-is-the-best-way-to-parse-html-in-c)從 – 2012-07-23 21:13:27

回答

0

是的,你可以使用HtmlAgilityPack,如果你想從標籤中提取文本

HtmlAgilityPack是一個HTML解析器,建立從「現實世界」的HTML文件的讀/寫DOM。它支持XPath或XSLT,是寬容與「現實世界」惡意的HTML

在一行它使用的XPath查詢,真正有助於快速提取數據

+0

不標籤恰好在標籤之後,有時是未格式化的文本,可能還有HAP? – Noxious 2012-07-24 07:40:40

+0

以html或純文本形式顯示您想要提取的內容 – HatSoft 2012-07-24 07:42:05