如果你想選擇網站上所有圖像的URL,你可以選擇所有圖像標籤,然後獲取絕對URL。
例子:
String html = "http://www.bbc.co.uk";
Document doc = Jsoup.connect(html).get();
Elements titles = doc.select("img");
for (Element e : titles) {
System.out.println(e.absUrl("src"));
}
這將抓住所有的<img>
元素和提交,如
http://sa.bbc.co.uk/bbc/bbc/s?name=SET-COUNTER&pal_route=index&ml_name=barlesque&app_type=web&language=en-GB&ml_version=0.16.1&pal_webapp=wwhp&blq_s=3.5&blq_r=3.5&blq_v=default-worldwide
http://static.bbci.co.uk/frameworks/barlesque/2.50.2/desktop/3.5/img/blq-blocks_grey_alpha.png
http://static.bbci.co.uk/frameworks/barlesque/2.50.2/desktop/3.5/img/blq-search_grey_alpha.png
http://news.bbcimg.co.uk/media/images/69139000/jpg/_69139104_69139103.jpg
http://news.bbcimg.co.uk/media/images/69134000/jpg/_69134575_waynerooney1.jpg
如果你只想要.JPG文件,告訴選擇通過包括
Elements titles = doc.select("img[src$=.jpg]");
這導致只解析.JPG-URL。
Daniel B通過'css'請求的圖像將不會成爲'html'源代碼中'
'標記的一部分。 –
Niranjan