我想解析和使用jsoup操縱HTML。它對大多數網址來說工作得很好,但在一些網站上卻失敗了。例如Jsoup在某些網站上失敗
這工作:
Document document = Jsoup.connect("https://www.yahoo.com/politics/time-to-take-sanders-seriously-1342599418519606.html")
.userAgent("Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.11 (KHTML, like Gecko) Chrome/23.0.1271.95 Safari/537.11 Firefox/19.0")
.timeout(10*1000)
.get();
這種失敗:
Document document = Jsoup.connect("http://www.sciencedaily.com/releases/2016/02/160201215944.htm")
.userAgent("Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.11 (KHTML, like Gecko) Chrome/23.0.1271.95 Safari/537.11 Firefox/19.0")
.timeout(10*1000)
.get();
在哪裏可以我是想錯了?
謝謝。
你得到的第二個例子的錯誤是什麼? –
@sparky沒有錯誤。沒有返回。由luksch的解釋是有道理的 –