我必須在C#中執行一個控制檯應用程序,該應用程序從特定網頁讀取一些文本。現在我有一些問題,因爲我不知道如何閱讀標籤之間的文本。 首先,我使用WebClient對象從網頁下載html代碼。C#獲取文本,替換HTML代碼的span標籤中的文本
WebClient client = new WebClient();
String htmlCode = client.DownloadString(link);
在htmlCode串,我標籤之間有一個圖像是一個加載杆的GIF。
<span id="bitrate_0"><img src="http://webpage.net/images/loading.gif" /></span>
如果我去到該網站從一個瀏覽器,並檢查部分,或者如果我使用網頁上的那部分檢查元素的功能(這說明我的html代碼),我有一個很長的文本(我需要要得到)。 另外,在瀏覽器中,如果我選擇查看源代碼,那麼仍然有這些代碼。
我需要獲取替換gif圖像的文本。我怎樣才能做到這一點?
謝謝。
您可能需要使用[HTML解析器(http://stackoverflow.com/questions/6063203/parsing-html-with-c-net) – Pete 2014-08-27 13:16:55
考慮使用[HTML Agility Pack](http://htmlagilitypack.codeplex.com/)在您的代碼中使用HTML。 – qJake 2014-08-27 13:17:05
好的。我會檢查兩個解決方案:)。謝謝 – 2014-08-27 13:19:50