2013-05-15 81 views
0

嗨,夥計們我試圖解析表中的每一行,然後把它的內容放在一個字符串中。像這樣的頁面http://reviews.cnet.com/consoles/sony-playstation-3-60gb/4507-10109_7-31355103.html分別解析每一行

我的目標是解析每個行的每個值不包括標籤,例如

內存| 60 GB CPU | 8核心

所以我需要解析表中所有規格的只值然後把每個天賦的價值在一個單獨的字符串

所以我需要用名稱的字符串具有URL解析值的內存和具有從URL中提取解析值的名稱CPU的字符串,等等。 我該如何取得成功?

Document doc = Jsoup.connect("http://reviews.cnet.com/consoles/sony-playstation-3-60gb/4507-10109_731355103.html").get();for (Element table : doc.select("table.tablehead")) { 
    for (Element row : table.select("tr")) { 
     Elements tds = row.select("td"); 
     if (tds.size() > 6) { 
      System.out.println(tds.get(0).text() + ":" + tds.get(1).text()); 
    String CPU = row.text(); 
    }}} 

回答

0

我建議你看一看Jsoup

+0

的Html,我試圖從網站 – user2350340

+0

JSoup是HTML解析器拿到表。 – Rudy

+0

試過Jsoup,但我有問題讓它正常工作。這裏是我的代碼 – user2350340