我在C#中爲webbrowser製作了一個html抓取器,但我被卡住了。 該網頁看起來是這樣的:webBrowser只抓取元素中的第一個屬性(當所有的類都是相同的名稱時)
<tbody class="first class"
<tc class="second class">
<td class=" ">abcdefg</td>
<td class=" ">1233456</td>
<td class=" ">qwertyo</td>
</tc>
我用這個代碼來獲取裏面的「第二課堂」的三類內容:
HtmlElementCollection theElementCollection = default(HtmlElementCollection);
theElementCollection = webBrowser1.Document.GetElementsByTagName("tbody");
foreach (HtmlElement curElement in theElementCollection)
{
curElement.GetElementsByTagName("tc");
curElement.GetElementsByTagName("td");
label1.Text = curElement.GetAttribute("InnerText");
return;
}
的問題是,這個店在label1的ALL 3項內容,所以它看起來像這樣:
abcdefg123456qwerto
因爲這些類都具有相同的名稱,所以我不能只抓取一個內容。
有沒有辦法只抓住元素內的第一個內容,使它看起來像這樣?
abcdefg
[0]?你必須在標籤上做foreach循環。 –
當我把它放在它給我一個錯誤只有賦值,調用,增量等錯誤,並且當放入foreach循環時它表示標識符預期,但我不確定什麼標識符。 – John
'curElement.GetElementsByTagName(「tc」)'你不使用返回的元素。 –