-1
A
回答
0
如果您想要從XHTML結構中提取特殊數據,請嘗試jsoup。它提供了類似jquery的方法來提取和操作XHTML。你可以迭代所有html dom元素並獲取文本屬性。
或者,如果您想刪除html標籤並僅保留文本,請嘗試使用正則表達式。看看這stackoverflow thread。
相關問題
- 1. 將HTML文本轉換爲純文本
- 2. 將HTML轉換爲純文本剃刀
- 3. 將NSAttributedString轉換爲純文本
- 4. Ruby:將HTML/Redcloth轉換爲純文本
- 5. 加速將RTF轉換爲純文本
- 6. 如何將純文本轉換爲ODF?
- 7. 將紡織品轉換爲純文本
- 8. 將網頁轉換爲純文本..?
- 9. 將純文本輸入轉換爲HTML
- 10. 如何將RTF轉換爲純文本?
- 11. 將html轉換爲純文本jquery .ajax
- 12. 如何將純文本轉換爲xsl
- 13. 將RTF轉換爲純文本格式
- 14. 將表單轉換爲純文本
- 15. 轉換Zalgo文本爲純文本
- 16. 將xml + xsd轉換爲xhtml
- 17. 將PSD轉換爲XHTML
- 18. 將XHTML轉換爲XAML FlowDocument
- 19. itext將xhtml轉換爲pdf
- 20. 將XHTML文章轉換爲Docbook
- 21. 如何將解析的文本轉換爲純文本
- 22. 如何將HTML文本轉換爲純文本?
- 23. 如何將Sql字符串文本轉換爲純文本
- 24. 如何將MySQL中的RTF文本轉換爲純文本?
- 25. 如何將html文本轉換爲報表中的純文本
- 26. 如何將降價(WMD)文本轉換爲純文本
- 27. 如何將純文本轉換爲android中的html文本?
- 28. 將純文本轉換爲XML(例如CSV轉換爲XML)的腳本
- 29. 將jquery腳本轉換爲純javascript
- 30. 通過C#將純文本格式轉換爲純文本格式?
你必須寫一些代碼。 – woz
XHTML到純文本到底是什麼意思? XHTML已經是一個純文本文件。嘗試在編輯器(記事本)中打開。 您的意思是刪除所有標籤嗎?請提供更多信息 – Makky
假設我有下面的XHTML,從那我需要提取「標題」和「身體」作爲明文有沒有辦法做到這一點使用Java/Unix腳本。 <!DOCTYPE html PUBLIC「 - // W3C // DTD XHTML 1.0 Transitional // EN」 「http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd」>
這是測試頁。
– Aravind