所以我想在「dd」-tag中列出所有列出的單詞,但我不知道如何獲取它們。我的意思是我嘗試了String getWord = doc.getElementsByTag("dd").select("a").attr("href");
,但它似乎不起作用。獲取div的文本是沒有問題的,但我不知道如何從「dd」標籤獲取文本並嘗試getElemenbyTag(「dd」)不起作用。
網站:http://www.dict.cc/englisch-deutsch/trim.html
任何幫助表示讚賞!
所以我想在「dd」-tag中列出所有列出的單詞,但我不知道如何獲取它們。我的意思是我嘗試了String getWord = doc.getElementsByTag("dd").select("a").attr("href");
,但它似乎不起作用。獲取div的文本是沒有問題的,但我不知道如何從「dd」標籤獲取文本並嘗試getElemenbyTag(「dd」)不起作用。
網站:http://www.dict.cc/englisch-deutsch/trim.html
任何幫助表示讚賞!
有不止一種方法可以用Jsoup做到這一點。我會這樣做:
String url ="http://www.dict.cc/englisch-deutsch/trim.html";
Document doc = Jsoup.connect(url)
.userAgent("Mozilla/5.0 ;Windows NT 6.1; WOW64; AppleWebKit/537.36 ;KHTML, like Gecko; Chrome/39.0.2171.95 Safari/537.36")
.get();
Elements wordAEls = doc.select("dd a");
for (Element wordA : wordAEls){
System.out.println(wordA.ownText());
}
請注意,我需要設置一個適當的用戶代理爲這個網站用html做出迴應。
選擇器只是選擇位於dd元素下的所有元素。
對於你給出的鏈接,單詞在a標籤裏面又是dd標籤。所以這裏有一種方法可以通過jQuery來提取單詞:
$("dd").children().each(function (index, element) {
console.log($(this).text());
});
這裏我只是將單詞打印到控制檯。您也可以嘗試使用html()代替文本()。
似乎它的工作,謝謝(第二次我猜;))! – moon
第二次?我不明白。無論如何,你是受歡迎的。 – luksch
http://stackoverflow.com/a/31636828/5157428 :) – moon