2014-01-18 87 views
4

嗨我想從使用jsoup的HTML文件中獲取某些文本。我已經知道如何獲得text2和text3。但是,如何在沒有其他人的情況下獲得我想要的文本?使用jsoup標記之後獲取特定文本

<div class="snt"> text I want 
<br clear="both" />text2 
<br clear="both" />text3 
<br clear="both" /> 
</div>  

我試圖用

Elements lines = doc.select(".snt"); 
lines.First().nextSibling().toString();  

,但我什麼也沒得到。我也試過:

Elements lines = doc.select(".snt"); 
lines.text(); // this return all texts together  

你能幫我嗎?謝謝您的回答。

回答

1

如果您嘗試使用ownText()作爲第一個元素,您將獲得「文本我想要text2 text3」,這是正確的。你需要br之前的文本,這是你的第一個元素下的第一個子節點。 Jsoup將文本處理爲一個節點。

Elements lines = doc.select(".snt"); 
System.out.println(lines.first().childNodes().get(0)); 
+2

我知道,我「應該避免這樣的評論」,但非常感謝。 :) – Yoda066

相關問題