我試圖從這個網站標籤如何使用C#
sometext
提取文本,我有這樣的代碼來提取網頁數據:
using System;
using System.Net;
using HtmlAgilityPack;
namespace GC_data_console
{
class Program
{
public static void Main(string[] args)
{
using (var client = new WebClient())
{
// Download the HTML
string html = client.DownloadString("https://www.requestedwebsite.com");
HtmlDocument doc = new HtmlDocument();
doc.LoadHtml(html);
foreach(HtmlNode link in
doc.DocumentNode.SelectNodes("//span"))
{
HtmlAttribute href = link.Attributes["id='example1'"];
if (href != null)
{
Console.WriteLine(href.Value.ToString());
Console.ReadLine();
}
}
}
}
}
}
}
但我仍然沒有得到文字「sometext」。
但是,如果我插入HtmlAttribute href = link.Attributes [「id」]; 我會得到所有的ID名稱。
我在做什麼錯了?
您可以分享您試圖獲取內容的實際URL嗎?你也試圖獲得'HtmlAttribute'的值而不是元素。你需要嘗試獲得的是'link.InnerText'。 –
你好,例如從這個網頁https://www.geocaching.com/geocache/GC257YR_slivercup-studios-east ,我想從標籤中獲取文本: SliverCup Studios East – Shiwers
知道了....你嘗試了我建議的另一種方式嗎?你是否也調試過並檢查你是否獲得了正確的元素? –