0
我試圖從一個博客文章了這樣的內容:如何從博客文章中正確提取內容?
static void GetBlogData (string blogPostUrl)
{
string blogPostContent = null;
WebClient client = new WebClient();
//client.Headers.Add (HttpRequestHeader.Referer, "http://www.stackoverflow.com");
TextWriter writer = new StreamWriter ("/home/nanda/projects/mono/common/article");
try
{
blogPostContent = client.DownloadString (blogPostUrl);
}
catch (Exception ex)
{
Term.PrintLn ("Unable to download\n{0}", ex.Message);
}
if (blogPostContent != null)
{
writer.WriteLine (blogPostContent);
}
else
{
Term.PrintLn ("No content found");
}
}
我知道這是太簡單的方法,但我想知道爲什麼我無法從像一些網址中提取內容他們有塊或什麼的。如何檢測網站/博客是否阻止我下載其內容?
他們可能會期待您發送cookie或登錄。 – 2012-07-19 07:33:45