2014-08-27 131 views
0

我必須在C#中執行一個控制檯應用程序,該應用程序從特定網頁讀取一些文本。現在我有一些問題,因爲我不知道如何閱讀標籤之間的文本。 首先,我使用WebClient對象從網頁下載html代碼。C#獲取文本,替換HTML代碼的span標籤中的文本

WebClient client = new WebClient(); 
String htmlCode = client.DownloadString(link); 

htmlCode串,我標籤之間有一個圖像是一個加載杆的GIF。

<span id="bitrate_0"><img src="http://webpage.net/images/loading.gif" /></span> 

如果我去到該網站從一個瀏覽器,並檢查部分,或者如果我使用網頁上的那部分檢查元素的功能(這說明我的html代碼),我有一個很長的文本(我需要要得到)。 另外,在瀏覽器中,如果我選擇查看源代碼,那麼仍然有這些代碼。

我需要獲取替換gif圖像的文本。我怎樣才能做到這一點?

謝謝。

+1

您可能需要使用[HTML解析器(http://stackoverflow.com/questions/6063203/parsing-html-with-c-net) – Pete 2014-08-27 13:16:55

+2

考慮使用[HTML Agility Pack](http://htmlagilitypack.codeplex.com/)在您的代碼中使用HTML。 – qJake 2014-08-27 13:17:05

+0

好的。我會檢查兩個解決方案:)。謝謝 – 2014-08-27 13:19:50

回答

1

只要你就會有它方便:

說完上面的話,如果你花時間去瀏覽上面的資料,你不應該有找到跨度和玩弄它的問題。

祝你好運:)

+0

我已經閱讀了w3schools的XPath教程,現在我正在嘗試使用HtmlAgilityPack,但我遇到了同樣的問題。 之間的文本仍然是一個圖像。我需要該地區的文字。 – 2014-08-28 07:00:10