我有一些問題,以獲得與IE10呈現完全相同的HTML字符串。 IE 10呈現的和使用WebClient.DownloadString(url)獲取的呈現略有不同。 (見this question)如何獲得完全像IE瀏覽器呈現的HTML字符串?
如何獲得究竟是相同的HTML字符串?我是否需要模擬瀏覽器行爲?
我有一些問題,以獲得與IE10呈現完全相同的HTML字符串。 IE 10呈現的和使用WebClient.DownloadString(url)獲取的呈現略有不同。 (見this question)如何獲得完全像IE瀏覽器呈現的HTML字符串?
如何獲得究竟是相同的HTML字符串?我是否需要模擬瀏覽器行爲?
這個問題是重複的這一個:How to get the page source from an IE window?
而且我已經有解決它。
嘗試增加對IE10的User-Agent頭您的要求:
WebClient client = new WebClient();
client.Headers.Add ("user-agent", "Mozilla/5.0 (compatible; MSIE 10.0; Windows NT 6.2; Trident/6.0)");
根據您的情況(移動,X64等),頭部可能有不同的值。其他示例見IE10 User Agent String Update。
謝謝,我試過但不工作。實際上,我添加了IE 10發送的所有標題,但仍然沒有運氣。 – smwikipedia
瀏覽器將自動調整源代碼的某些方面以製作可渲染的對象模型。唯一完全可靠的方法是某種形式的模擬/自動化,然後從內存中檢索DOM。 –
這實際上意味着我必須啓動IE來瀏覽URL,對吧? – smwikipedia