在某些HTML清理的情況下,我想保留標記之間的文本(這是Jsoup的默認行爲),並且在某些情況下,我想刪除文本以及HTML標籤。有人可以拋出一些關於如何使用Jsoup刪除HTML標籤之間的文本的說明嗎?使用JSoup刪除HTML標記之間的文字
5
A
回答
10
Cleaner將始終刪除標籤並保留文本。如果您需要刪除元素(即標記和文本/嵌套元素),則可以預解析HTML,使用remove()
或empty()
刪除元素,然後通過清理器運行結果。
例如:
String html = "Clean <div>Text dropped</div>";
Document doc = Jsoup.parse(html);
doc.select("div").remove();
// if not removed, the cleaner will drop the <div> but leave the inner text
String clean = Jsoup.clean(doc.body().html(), Whitelist.basic());
0
1. String html = "<!DOCTYPE html><html><head><title></title></head><body><p>hello there</p></body></html>";
2. Document d = Jsoup.parse(html);
3. System.out.println(d);
4. System.out.println("************************************************");
5. d.getElementsByTag("p").remove();
6. System.out.println(d);
,而你得到的元素,你得到一些麻煩,你可以做文檔d對象這個動作。這將工作準確。
相關問題
- 1. 使用jsoup在html標記之間獲取文本
- 2. jsoup:刪除iframe標記
- 3. Jsoup只刪除html標籤
- 4. Grunt任務:刪除HTML文件中標記之間的線條
- 5. 如何使用jsoup在html文件的開頭刪除標題?
- 6. JSoup,從HTML它沒有標記刪除文本
- 7. 如何使用jsoup刪除html文檔中的所有非標記?
- 8. 使用jsoup從HTML文件還原已刪除的標記元素
- 9. 刪除從HTML文件標籤之間的一些文字
- 10. 刪除HTML中標記之間的空白空間
- 11. 刪除2個字符串之間的文本(html標籤)
- 12. 刪除錨標記之間的空格
- 13. 刪除html標籤之間的空格?
- 14. 刪除標記之間的換行符在HTML中python3
- 15. 在html標記之前和之後刪除文本
- 16. 無法使用.replaceWith()函數刪除標記之間的所有html代碼
- 17. 使用jquery/javascript刪除html標記
- 18. 使用javascript刪除HTML h1空標記
- 19. 使用Ruby刪除某些HTML標記
- 20. 使用preg_replace刪除html標記
- 21. 刪除HTML標記和使用jQuery
- 22. 使用JsHtmlSanitizer刪除每個html標記
- 23. 使用JSoup檢索p標籤之間的所有html
- 24. 如何使用mongodb從html文檔中刪除html標記
- 25. html標記之間的preg_match
- 26. 提取HTML標記之間的文本
- 27. 動態刪除html文件的腳本標記之間的所有內容
- 28. 使用Perl從兩個標記點之間的文件中刪除文本塊
- 29. 刪除XML中特定標記之間的標記(Notepad ++)
- 30. JSoup - 按標記解析HTML標記
6個問題並沒有被接受。你不明白這裏給你的幫助嗎? –