2012-02-23 179 views
5

如何從以下使用Jsoup的html代碼獲取「本文」?如何使用Jsoup獲取此文本?

<h2 class="link title"><a href="myhref.html">this text<img width=10 
     height=10 src="img.jpg" /><span class="blah"> 
     <span>Other texts</span><span class="sometime">00:00</span></span> 
     </a></h2> 

當我嘗試

String s = document.select("h2.title").select("a[href]").first().text(); 

返回

這textOther texts00:00

我試圖在Jsoup閱讀API爲Selector想不出出多了。

另外我如何獲得類class="link title blah"(多個類?)的元素。原諒我,我只知道Jsoup和CSS。

回答

9

使用Element#ownText()而不是Element#text()

String s = document.select("h2.link.title a[href]").first().ownText(); 

請注意,您可以通過只串聯的類名選擇在一起,就像是h2.link.title這將選擇至少有兩個linktitle元素<h2>選擇多類元素。

+0

謝謝你,工作得很好:) – wildnux 2012-02-23 16:50:07

+0

另外我如何獲得類'class =「鏈接標題等等」(多個類)的元素? – wildnux 2012-02-23 16:51:17

+0

仔細檢查代碼示例。之後我給答案添加了解釋。 – BalusC 2012-02-23 16:52:21