2015-10-03 60 views
1

enter image description here如何獲得「dd」-tag的文本?

所以我想在「dd」-tag中列出所有列出的單詞,但我不知道如何獲取它們。我的意思是我嘗試了String getWord = doc.getElementsByTag("dd").select("a").attr("href");,但它似乎不起作用。獲取div的文本是沒有問題的,但我不知道如何從「dd」標籤獲取文本並嘗試getElemenbyTag(「dd」)不起作用。

網站:http://www.dict.cc/englisch-deutsch/trim.html
任何幫助表示讚賞!

回答

1

有不止一種方法可以用Jsoup做到這一點。我會這樣做:

String url ="http://www.dict.cc/englisch-deutsch/trim.html"; 
Document doc = Jsoup.connect(url) 
     .userAgent("Mozilla/5.0 ;Windows NT 6.1; WOW64; AppleWebKit/537.36 ;KHTML, like Gecko; Chrome/39.0.2171.95 Safari/537.36") 
     .get(); 

Elements wordAEls = doc.select("dd a"); 
for (Element wordA : wordAEls){ 
    System.out.println(wordA.ownText());  
} 

請注意,我需要設置一個適當的用戶代理爲這個網站用html做出迴應。

選擇器只是選擇位於dd元素下的所有元素。

+0

似乎它的工作,謝謝(第二次我猜;))! – moon

+0

第二次?我不明白。無論如何,你是受歡迎的。 – luksch

+0

http://stackoverflow.com/a/31636828/5157428 :) – moon

-1

對於你給出的鏈接,單詞在a標籤裏面又是dd標籤。所以這裏有一種方法可以通過jQuery來提取單詞:

$("dd").children().each(function (index, element) { 
    console.log($(this).text()); 
}); 

這裏我只是將單詞打印到控制檯。您也可以嘗試使用html()代替文本()。