我想刮一個網站的HTML。當我用我的瀏覽器訪問這個網站時(不管它是Chrome還是FireFox),訪問網站+ HTML都沒有問題。如何檢索HTML頁面而不重定向?
當我嘗試用C#使用類似HttpWebRequest
和HtmlAgilityPack
的方法解析HTML時,網站將我重定向到另一個網站,因此我解析了重定向網站的HTML。
任何想法如何解決這個問題?
我認爲該網站認識到我的程序是一個程序,並立即重定向,所以我嘗試使用Selenium和GoogleDriver和FireFoxDriver,但也沒有運氣,我立即重定向。
網站:https://www.jodel.city/7700#!home
private void bt_load_Click(object sender, EventArgs e)
{
var url = @"https://www.jodel.city/7700#!home";
var req = (HttpWebRequest)WebRequest.Create(url);
req.AllowAutoRedirect = false;
// req.Referer = "http://www.muenchen.de/";
var resp = req.GetResponse();
StreamReader sr = new StreamReader(resp.GetResponseStream());
String returnedContent = sr.ReadToEnd();
Console.WriteLine(returnedContent);
return;
}
因此,如果沒有人可以訪問它,那麼背後呢?只有德國IP的東西? –