2012-11-12 42 views
0

我試圖分析此鏈接wget的,捲曲,HTML解析器無法得到正確的HTML

http://www.sears.com/search=play%20station?pageNum=1&viewType=list 

如果我打開我的瀏覽器的網站它完美。然而,沒有解析器似乎工作(嘗試jsoup)。此外,我試圖做一個捲曲和wget的網址和輸出是不正確的。

我試圖檢查網站是否實際重定向(301,302),但顯然它沒有。

有沒有人知道我可能做錯了什麼?

+0

我想這可能是用戶代理搶,但似乎並沒有被它。 – singpolyma

+0

某些網站似乎對某些不明身份的請求具有某種類型的攔截器。 Facebook有類似的東西。 – elimirks

回答

1
+0

它不起作用。我注意到了JavaScript重定向,但我認爲它不重要。 如果你curl -L那個URL你會得到的東西,但它是錯誤的數據。只是檢查標題: