2013-03-20 28 views
1

我有以下問題。我的C#應用​​程序使用了webrequest,並且重複了URL的html代碼,以便稍後做一些事情。儘管一切正常,但有些網站在訪問時會將您重定向到另一個網站(例如http://something.com/disclamer),並在您點擊是後返回到原始網站。C#以介紹網站的html代碼而不是實際的代碼,如何跳過?

當我運行我的應用程序時,它總是隻檢查免責聲明頁面的html代碼,並且永遠不會到達我要求的實際頁面。在這一點上我找不到解決方案,因爲在免責聲明網站的簡短HTML代碼中找不到任何有用的內容(在我要檢查的代碼之前)。

有關我如何跳過這段代碼並獲取我真正感興趣的網站代碼的任何想法?請注意,我無法在這兩個網站的任何一箇中找到任何html重定向代碼指示(META HTTP-EQUIV等)。

謝謝

回答

1

您可以檢查StatusCode以決定您是否被重定向。 30x的狀態代碼會告訴您您已被重定向,在這種情況下,您需要按照重定向中的鏈接進行操作。

http://msdn.microsoft.com/en-GB/library/system.net.httpwebresponse.statuscode.aspx

+0

恐怕不是那種重定向。通過點擊「是」按鈕,您可以向服務器發送一個

+0

如果您嘗試實施一個webcrawler來處理所有客戶端黑客和邊緣案例看看Google如何抓取你的網頁,主要是與狀態碼和http get相關,還有別的......所有的賭注都沒有了,如果你能更清楚地知道'其他的東西'這是你想要做的,你可能會發現另一種解決方案可能適合在這裏。 – Dan 2013-03-31 13:23:15

0

我相信你要分析這樣一個頁面的HTML代碼,並聲明要知道使用哪種方法有做重定向。每種情況都可能不同:它可以是客戶端重定向或服務器端重定向。如果此免責聲明按鈕提交表單,則需要發出POST請求模仿按鈕單擊。

+0

就是這樣,你開啓一個

相關問題