我正在構建一個需要從合作伙伴網站刮取信息的網站。現在我的刮碼與其他網站很好,但不是這個。它是一個普通的.html網站。我的想法是,它可能會產生一些如何與PHP(網站是用PHP構建的)。爲什麼我不能刮網站的任何想法?
我不知道我只是猜測生成的部分,我需要你的專業人士幫助。如果重要的話,我使用的是我的代碼。 htmlDocument是htmlAgilityPack,但與它無關。結果在我嘗試的網站上爲空。
string result;
var objRequest = System.Net.HttpWebRequest.Create(strUrl);
var objResponse = objRequest.GetResponse();
using (var sr = new StreamReader(objResponse.GetResponseStream()))
{
result = sr.ReadToEnd();
sr.Close();
var doc = new HtmlDocument();
doc.LoadHtml(result);
foreach (var c in doc.DocumentNode.SelectNodes("//a[@href]"))
{
litStatus.Text += c.Attributes["href"].Value + "<br />";
}
}
編輯:
這是從W3驗證,可能有這個東西嗎?
對不起,我無法驗證該文檔,因爲上線422是包含在一個或 更多,我不能解釋爲UTF-8字節(換言之,發現字節不是在指定的字符編碼有效 值)。請檢查文件內容和 字符編碼指示。
錯誤是:UTF8「版權所有\ xA9」不映射到Unicode
那麼'result'的值是什麼? – 2010-01-18 12:42:49
@Marc:OP狀態「結果爲null,我試着在網站上」 – 2010-01-18 12:44:35
我試過用maby 15個網站,我需要的是唯一一個null .. – 2010-01-18 12:46:06