1
我完全是HTML敏捷包的新手,我如何使用C#中的HTML敏捷包來抓取這些內容(代理)。如何使用HTML敏捷包來抓取內容
我的代碼:
string url = "http://www.proxybase.de/";
HtmlWeb web = new HtmlWeb();
HtmlAgilityPack.HtmlDocument doc = web.Load(url);
var nodes = doc.DocumentNode.SelectNodes("//table[@border='0' and @cellspacing='0' and @cellpadding='0']");
if (nodes != null)
{
foreach (HtmlNode item in nodes)
{
if (item != null)
{
string s = item.InnerText;
listView1.Items.Add(s);
}
}
}
else
{
MessageBox.Show("Nothing found");
}
的HTML看起來喜歡...
<table border="0" cellpadding="0" cellspacing="0">
<tbody>
<tr>...</tr> //Ignore first one
<tr>
<td>...</td>
<td style="padding-left:5px;border-left;1px solid #999;"> 123.45.678.90:80 </td>
<td style="padding-left:5px;border-left;1px solid #999;">...</td>
</tr>
</tbody>
</table>
修訂:
如何使用的SelectSingleNode選擇Ť有索引數組的數據?
在您的示例中修復了一個錯字。它應該是'// td'而不是'// tr'。 –
感謝編輯卡爾。 – RinikS