2014-02-28 390 views
0

如何使用Jsoup解析庫來解析html文件,使得標籤應該與空白具有相同的效果?如何使用Jsoup解析html文本?

例如。

如果我使用Jsoup解析函數解析如下字符串

word<br>one<br>is<br>one<br>word 

我應該得到

word one is one word 

而不是

wordoneisoneword 
+0

Jsoup是一個分析器,而不是一臺打印機,所以當你有在印刷錯誤的結果,似乎最有可能在您的打印算法錯誤而不是解析。另外,請發佈您的代碼到目前爲止。 – Smutje

+0

你可以做一些基本的輸出,例如。文本/字符串或HTML源。但是如果你需要進一步格式化,你自己實現它。 – ollo

+0

從ollo的答案中可以看出,你期望的行爲就是默認獲得的行爲,所以這個錯誤在你的代碼中。爲了進一步幫助您,我們需要查看該代碼。 –

回答

1

請看這裏:

final String html = "word<br>one<br>is<br>one<br>word"; 
Document doc = Jsoup.parse(html); 

String output = doc.text(); 

System.out.println(output); 

輸出:

word one is one word