我試圖從Google購物(http://www.google.co.uk/m/products?q=5010459007289,電話網站)提取產品名稱信息。使用JSoup提取數據
產品名稱總是出現在帶班「owb63p」跨度之間,例如
"<span class="owb63p">Highland Spring Sports Bottle 750 Ml</span>"
我是新與JSoup,我可以用URL連接,並獲得整份文件,但我只需要幫助設置它,以便我只獲取我需要的信息。
感謝
我試圖從Google購物(http://www.google.co.uk/m/products?q=5010459007289,電話網站)提取產品名稱信息。使用JSoup提取數據
產品名稱總是出現在帶班「owb63p」跨度之間,例如
"<span class="owb63p">Highland Spring Sports Bottle 750 Ml</span>"
我是新與JSoup,我可以用URL連接,並獲得整份文件,但我只需要幫助設置它,以便我只獲取我需要的信息。
感謝
我不喜歡JSoup多,但與Apache jericho它想:
Source source=new Source(new URL(sourceUrlString));
String content=source.getFirstElementByClass("owb63p").getContent().toString();
看起來JSoup examples有你在找什麼。
在JSoup它會像:
Document doc = Jsoup.connect("www.google.co.uk/m/products?q=5010459007289").get();
Element title = doc.select("span.owb63p").first();
System.out.println(title.text());
你可以嘗試
doc.select("span").get(0).data();
,或者你可以簡單地遍歷多個span標籤...
我已成功地選擇整個「span」線,通過使用:\t \t \t \t \t Element masthead = doc.select(「span.owb63p」)。first();然後只是分割字符串以獲取產品名稱。這是正確的方法嗎? – Pedro 2012-02-25 14:22:56