1
我想找出關鍵字在網頁中的總字數比率,我使用jsoup來解析網頁的HTML。我想知道如何使用JSOUP查找網頁中關鍵字的數量。我想知道JSOUP中是否有這樣的功能,謝謝!使用jsoup查找HTML中的關鍵字的計數
我想找出關鍵字在網頁中的總字數比率,我使用jsoup來解析網頁的HTML。我想知道如何使用JSOUP查找網頁中關鍵字的數量。我想知道JSOUP中是否有這樣的功能,謝謝!使用jsoup查找HTML中的關鍵字的計數
我不認爲有一種計算Jsoup中的單詞的方法,因爲JSoup只是解析html/xml。如果您可以使用Element.text()來獲取所有文本(包括可能由於css規則(如隱藏)而無法呈現的內容)。詳情請參閱here。現在
Element body = doc.body();
String allText = body.text();
,你可以做各種文字處理與allText
的字符串。良好的文字處理庫可能是apache lucene或更簡單的東西,如Wordcounter