如果我嘗試從該域檢索Document.baseUri()的URL的 -Jsoup Document.baseUri()問題
http://www.deliciousmagazine.co.uk/articles/mid-week-meals
返回http://www.deliciousmagazine.co.uk。
對於其他URL,Document.baseUri()返回整個URL。
E.g.
https://stackoverflow.com/about
將返回
https://stackoverflow.com/about。
我注意到的唯一事情就是HTML響應返回一個帶有以下信息的標籤。
<base href="http://www.deliciousmagazine.co.uk/" />
這是我能想到的唯一導致這個問題的事情。即使這個元素存在,如果我想要整個URL,該怎麼辦?我可以通過什麼方法調用Document來檢索它?
示例代碼
Document doc = null;
try {
doc = Jsoup.connect(url).userAgent("Mozilla").get();
} catch (IOException e) {
e.printStackTrace();
}
System.out.println(doc.baseUri());
我看着源和HTMLTreeBuilder類設置的基本URI與它在文件中遇到的第 元素的href。我建議在Document上使用另一種方法來返回從中解析HTML的Document的URI。 Document.getSourceUri()或類似的。 –
user1796571
2013-03-09 15:43:59