我需要將降價文本轉換爲純文本格式才能在我的網站上顯示摘要。我想在Python中的代碼。Python:如何將降價格式文本轉換爲文本
22
A
回答
36
此模塊將幫助你描述一下:
http://www.freewisdom.org/projects/python-markdown/Using_as_a_Module
一旦轉換降價到HTML,您可以使用HTML解析器來剔除純文本。
您的代碼可能是這個樣子:
from BeautifulSoup import BeautifulSoup
from markdown import markdown
html = markdown(some_html_string)
text = ''.join(BeautifulSoup(html).findAll(text=True))
+1
它似乎像轉換爲HTML ..我需要轉換爲純文本..就像在stackoverflow,在主頁問題總結,它刪除格式 – Krish 2009-04-17 19:30:10
2
評論,並刪除它,因爲我終於覺得我看到這裏的困難:它可能是更容易的降價文本轉換爲HTML,並從文本中刪除HTML 。我不知道有什麼可以有效地從文本中刪除降價,但有很多HTML到純文本解決方案。
相關問題
- 1. 如何將降價(WMD)文本轉換爲純文本
- 2. 將降價文本轉換爲ipython筆記本
- 3. 如何使用Python將文本轉換爲Json格式
- 4. 如何將文本格式列表轉換爲python列表
- 5. Django文本格式化,標記?降價?
- 6. 未將文本轉換爲HTML格式
- 7. VB.Net將文本轉換爲WWW格式
- 8. 將文本轉換爲PDU格式
- 9. 將RTF轉換爲純文本格式
- 10. JSON - 如何將純文本格式轉換爲json格式?
- 11. 使用Python將文本文件轉換爲JSON格式
- 12. 如何將公式轉換爲文本?
- 13. 如何將文本文件轉換爲.arff格式(weka)
- 14. 如何將兩列的文本文件轉換爲fasta格式
- 15. 將文本文件的格式轉換爲其他格式
- 16. 如何將當前文本替換/轉換爲所需格式?
- 17. 文檔格式轉換爲文本
- 18. 將文本框中的文本轉換爲十進制格式
- 19. Python 3:如何將原始格式的unicode文本轉換?
- 20. 如何將HTML轉換爲降價?
- 21. 想要將html轉換爲python格式的ASCII文本(ansi possible)
- 22. 解決方案將PDF,DOC,DOCX轉換爲python文本格式
- 23. 將asciidoc轉換爲降價
- 24. 將文字文本轉換爲公式
- 25. 通過C#將純文本格式轉換爲純文本格式?
- 26. 如何在tkinter中顯示降價格式文本?
- 27. 如何將字符串轉換爲格式文本C#
- 28. 如何在Excel中將文本轉換爲日期格式
- 29. 如何將純文本數據轉換爲託管格式?
- 30. 如何將純文本轉換爲HTML中的html格式
不是python,但是你可以把它傳遞給pandoc:`pandoc --to = plain`留下一些格式(header undelines),但不是很多。 – naught101 2014-05-29 06:22:00