我正試圖在Python中解析格式錯誤的XHTML頁面。我只想從它那裏得到一些相同類型的標籤,但似乎不可能。普通的XHTML解析器不喜歡格式錯誤,並且由於其代碼中的語法錯誤,BeautifulSoup將不起作用。解析格式錯誤的XHTML並獲取相同類型的幾個標籤的內容的最佳方式是什麼?使用Python 3.2解析XHTML
0
A
回答
0
感謝您的幫助! 「不幸的是」我通過使用this解析器和設置html.parser.HTMLParser(strict=False)
來解決它。這使得它讀得格式不正確的XHTML相當好。
0
您可以嘗試pyquery
我不知道有多少畸形的XHTML是,但它是值得一試。
2
「正常」解析器? lxml通常可以處理格式錯誤的html,儘管它非常「正常」。 :-)
相關問題
- 1. 在Python 2.6中解析xhtml
- 2. 使用Ruby解析XHTML
- 3. 使用HTMLAgilityPack解析XHTML
- 4. 使用xml.etree.ElementTree解析XHTML
- 5. iPhone解析xhtml + css
- 6. 使用SAX解析XHTML只更改PCDATA
- 7. 如何使用DOM解析器解析xhtml忽略DOCTYPE聲明
- 8. 使用DocumentBuilder解析XHTML時出現無限循環「解析」
- 9. 解析Objective-C中的XHTML
- 10. 如何Android的XHTML解析
- 11. 在iPhone SDK解析xhtml?
- 12. 用內聯標籤解析XHTML
- 13. 在VBScript中使用Microsoft.XMLHTTP解析XHTML使用Microsoft.XMLHTTP
- 14. 使用python解析Ajax
- 15. 解析了有使用Python
- 16. 使用XML解析Python XML
- 17. 使用ElementTree解析XML Python
- 18. 使用Python解析CSV
- 19. 使用ElementTree解析XML -python
- 20. 使用python解析結果
- 21. 使用Python解析XML
- 22. 使用python解析樹
- 23. 問題解析使用Python
- 24. 使用Python解析HTML
- 25. 使用Python解析JSON?
- 26. 使用lxml解析HTML(python)
- 27. 使用Python解析HTML
- 28. 解析XML使用Python
- 29. 如何解析jquery ajax xhtml響應?
- 30. 無法解析linux上的xhtml文件
請記住,strict = False是默認值,它自Python 3.3以來已被棄用,它將在Python 3.5中被刪除。 –