我正在嘗試閱讀包含非延遲重定向的頁面的HTML。下面的代碼片段(C#)會給我的目的地/重定向頁面,而不是最初的一個我需要看到:如何在重定向之前捕獲重定向頁面的HTML?
using System.Net;
using System.Text;
public class SomeClass {
public static void Main() {
byte[] data = new WebClient().DownloadData("http://SomeUrl.com");
System.Console.WriteLine(Encoding.ASCII.GetString(data));
}
}
有沒有辦法得到一個重定向頁面的HTML? (我更喜歡.NET,但在Java或Python中的代碼片段也可以。Thx!)
有趣。我想我以前只見過基於客戶端腳本的重定向,並不知道服務器類型。 (Web dev並不是我的專長;-) +1,謝謝 – 2010-09-07 18:56:18
他希望獲得重定向頁面的來源,而不是被重定向到的頁面。 – CyberDude 2010-09-07 18:56:32
一些糟糕的程序員使網頁發送重定向頭,但忘記停止執行,所以雖然瀏覽器和http客戶端將遵循重定向,但仍然會有沿着線的內容字節。 (通常一個網絡服務器會輸出一些HTML鏈接到目標頁面,對於老客戶和東西)。 – aularon 2010-09-07 18:59:44