我抓取某個網頁www.thenextweb.com在C#中使用HtmlAgilityPack節點的列表中提取特定的節點值
我想提取所有帖子的鏈接,文章內容,文章圖像等
我寫了這個代碼...
string url = TextBox1.Text.ToString();
var webGet = new HtmlWeb();
var document = webGet.Load(url);
var infos = from info in document.DocumentNode.SelectNodes("//div[@class='article-listing']")
select new
{
Contr = info.InnerHtml
};
lvLinks.DataSource = infos;
lvLinks.DataBind();
這extracs從頁面中所有需要的信息......我已經使用使用ListView控件在asp.net頁面首頁此informatin作爲
<li> <%# Eval("Contr") %> </li>
現在,我想要的是一種方法trhough,我可以提取節點信息 我們都存在於相關信息方含鏈接URL,後期圖片文字等
的節點我想辦法讓我可以將它們存儲爲URL [0],PostContent [0],PostImage [0],Date [0]和URL [1],PostContent [1]等等,所有這些都包含被存儲在這些數組字符串中的重要值。 ... ...每個職位一個接一個...
它就像從信息的內部節點逐一提取信息。
請推薦一個方法嗎?
嘿,我沒有清楚地告訴你...你能否提供完整的代碼來訪問我的問題中提到的信息? – ItsLockedOut 2012-01-05 07:23:34
@iKunu - 查看更新 – 2012-01-05 17:38:18
謝謝...我現在就開始工作 – ItsLockedOut 2012-01-05 18:17:28