2012-05-13 29 views
1

我想從html代碼的「tablerow」內容中提取一些html元素並創建一個自動化應用程序。可以通過httpwebrequest和httpwebresponse幫助我做到這一點?如果是的話, 可以讓任何人看到這樣做的樣本...提前感謝您獲取html元素<tr> ....</tr>在c#中創建httpwebrequest#

+0

谷歌如何使用HttpWebRequest的,最後當你有源響應的html頁面的代碼,使用正則表達式提取有價值的信息,就像您解釋正常文本一樣。 – SimpleVar

回答

0

我會去從nuget HtmlAgilityPack。 WebClient更容易,但HttpWebRequest更強大,並允許更多的控制。正則表達式可以工作,但通常是一種痛苦。如果你想將這個文件是不夠好格式化快速的XPath有問題的元素通常是更容易和更清潔,所以嘗試這樣的事:


var client = new WebClient(); 
//var html = client.DownloadString("YOURURL"); 
var html = "<html><body><table><tr><td></td></tr></table></body></html>"; 
var document = new HtmlDocument(); 
document.LoadHtml(html); 
var nodes = document.DocumentNode.SelectNodes("//body/table"); 

Console.WriteLine(nodes[0].InnerHtml); 
Console.ReadLine();