2015-06-23 37 views

回答

1

我不認爲有一種計算Jsoup中的單詞的方法,因爲JSoup只是解析html/xml。如果您可以使用Element.text()來獲取所有文本(包括可能由於css規則(如隱藏)而無法呈現的內容)。詳情請參閱here。現在

Element body = doc.body(); 
String allText = body.text(); 

,你可以做各種文字處理與allText的字符串。良好的文字處理庫可能是apache lucene或更簡單的東西,如Wordcounter