我試圖實現的是提取所有鏈接,其中包含以http://,https://或/開頭的href屬性。這些鏈接位於具有特定類別的表格(tbody> tr> td等)中。我以爲我可以指定一個沒有整個路徑的元素,但它似乎不工作。使用XPath(和HtmlAgilityPack)從Html表中選擇所有鏈接
var table = doc.DocumentNode.SelectSingleNode("//table[@class='containerTable']");
if (table != null)
{
foreach (HtmlNode item in table.SelectNodes("a[starts-with(@href, 'https://')]"))
{
//not working
我不知道任何建議或最佳實踐,當涉及到的XPath:我在這個選擇的鏈接線得到一個NullReferenceException。當我查詢文檔兩次時,是否會創建開銷?
在我的解決方案中,我爲所有應選擇的三個不同的''節點提供一個XPath表達式。另外,在文檔中查找所有''節點會更加精確和高效(作爲另一個答案建議 - // a) – 2010-03-21 04:40:40