2013-02-24 39 views
0

如何從此示例HTML代碼中提取全名? 我只想得到以下內容。如何使用Jsoup提取特定的內容?

全名1

全名2

全部NAME3

<div class="readerP"> 
              <p><a href="link1_english.html" title="Complete" >Full name1</a><br>[ other info ]</br> </p> 
              </di           
<div class="readerP"> 
              <p><a href="link2_english.html" title="Complete" >Full name2</a><br>[ other info ]</br> </p> 
              </div> 
<div class="readerP"> 
              <p><a href="link1_english.html" title="Complete" >Full name3</a><br>[ other info ]</br> </p> 
              </div> 

我使用這個代碼,但它看起來頁面中所有的 'a' 標籤,所以我會得到額外的信息。

首頁

關於

聯繫

全名1

全名2

全部NAME3

等等...

try { 
     doc = Jsoup.connect("http://www.somesite.com").get(); 
     Elements links = doc.getElementsByTag("a"); 
     for (Element el : links) { 
      linkText = el.ownText(); 

      arr_linkText.add(linkText); 
     } 
    } catch (IOException e) { 
     // TODO Auto-generated catch block 
     e.printStackTrace(); 
    } 

我如何看 'DIV' 的標籤,如果類= 「readerP」看看「'div'內的''標籤?

回答

0

我怎樣才能看'div'標籤,如果class =「readerP」看'div'裏的'a' 標籤?

使用合適的選擇器,而不僅僅是通過標籤進行搜索。

Elements links = doc.select("div .readerP a"); 

閱讀有關Jsoup documentation中選擇器的更多信息。

+0

它沒有工作。我更新了我的帖子,請看看它。 – Ammar 2013-02-24 02:35:58

+0

請仔細檢查我的帖子,因爲之前有過更新。你必須使用'select'方法,而不是'getElementsByTag'。 – 2013-02-24 02:37:11

+0

你是老闆胡安。現在它運行起來,它的速度非常快。 – Ammar 2013-02-24 02:39:14