2012-06-13 83 views
1

我想通過html文件搜索,然後將url獲取到該頁面上的圖片。這個URL然後應該被保存爲一個字符串 - 多數民衆贊成在所有。問題是我真的不知道如何開始。解析HTML文件中的圖片url

我的應用程序當然知道圖像所在頁面的網址。 作爲一個例子讓我們這個網址:


在這個頁面上我所需要的大圖像作爲字符串的URL。當我查看源代碼,我可以找到的網址,但我不知道如何代碼 - 這是我需要的網址:


(只引號內的文字)。

回答

4

使用JSoup。這是一個HTML解析器,可以讓你使用css選擇器(如jQuery)訪問DOM元素。

// Parse your HTML: 
// 1. From string: 
Document doc = JSoup.parse(htmlAsString); 

// 2. Or from an URL: 
Document doc = JSoup.connect("http://my.awesome.site.com/").get(); 

// Then select images inside it: 
Elements images = doc.select("img"); 

// Then iterate 
for (Element el : images) { 
    String imageUrl = el.attr("src"); 

    // TODO: Do something with the URL 
} 
0

好吧,這做的工作:)我現在得到的圖像網址:

public class jSoupEx { 

    private static final String elements = null; 

    public static void main(String args[]){ 


     try { 
      Document doc = Jsoup.connect("http://***/index.php/Datei:***.jpg").get(); 
      Element image = doc.select("img").first(); 
      String url = image.absUrl("src"); 
      System.out.println(url); 

     } catch (IOException e) { 
      // TODO Auto-generated catch block 
      e.printStackTrace(); 
     } 
} 

}