2012-02-25 167 views
0

我試圖從Google購物(http://www.google.co.uk/m/products?q=5010459007289,電話網站)提取產品名稱信息。使用JSoup提取數據

產品名稱總是出現在帶班「owb63p」跨度之間,例如

"<span class="owb63p">Highland Spring Sports Bottle 750 Ml</span>" 

我是新與JSoup,我可以用URL連接,並獲得整份文件,但我只需要幫助設置它,以便我只獲取我需要的信息。

感謝

+0

我已成功地選擇整個「span」線,通過使用:\t \t \t \t \t Element masthead = doc.select(「span.owb63p」)。first();然後只是分割字符串以獲取產品名稱。這是正確的方法嗎? – Pedro 2012-02-25 14:22:56

回答

0

我不喜歡JSoup多,但與Apache jericho它想:

  Source source=new Source(new URL(sourceUrlString)); 
    String content=source.getFirstElementByClass("owb63p").getContent().toString(); 
1

在JSoup它會像:

Document doc = Jsoup.connect("www.google.co.uk/m/products?q=5010459007289").get(); 
Element title = doc.select("span.owb63p").first(); 
    System.out.println(title.text()); 
0

你可以嘗試

doc.select("span").get(0).data(); 

,或者你可以簡單地遍歷多個span標籤...