我想知道是否有方法從HTML表格中提取數據並僅使用HTMLParser將其解析爲字典。由於某種原因,我無法做到這些。解析HTML表格到Python中的列表W/o BeautifulSoup
0
A
回答
1
您可以使用lxml來解析網頁。 http://lxml.de/
你可以湊一個網頁與
from lxml.html import parse
site = parse('http://java.sun.com')
這是怎麼回是lxml的元素樹:http://lxml.de/api.html
然後,您可以使用XPath來獲取HTML內容(HTTP:// WWW。 w3schools.com/xpath/):
tableData = site.xpath('//table//td[@id="someTdID"]')
LXML是一個非常強大的庫,並廣泛用於抽取數據。然後,您可以將這些數據提供給python字典/列表或按照您的喜好進行處理。
+0
我想只使用HTMLParser來做到這一點..可能嗎? – 2012-03-05 06:23:50
相關問題
- 1. BeautifulSoup(Python)和解析HTML表格
- 2. BeautifulSoup HTML表格解析
- 3. 用BeautifulSoup解析HTML表格
- 4. 解析HTML表BeautifulSoup
- 5. HTML解析表 - BeautifulSoup
- 6. Python,BeautifulSoup解析表
- 7. 使用python解析HTML中的表格
- 8. 用BeautifulSoup解析嵌套的HTML列表
- 9. 解析表BeautifulSoup的Python
- 10. 使用Python和BeautifulSoup解析表格
- 11. 解析HTML表格
- 12. 的Python - BeautifulSoup - HTML解析
- 13. Python的Beautifulsoup解析HTML
- 14. 解析HTML的Python,BeautifulSoup
- 15. Python,解析html表格
- 16. 解析HTML表格
- 17. Python:用BeautifulSoup解析HTML
- 18. Python - Error解析HTML w/BeautifulSoup
- 19. BeautifulSoup python解析html文件
- 20. Python和BeautifulSoup解析HTML
- 21. 用BS4解析HTML表格
- 22. 在python中使用beautifulsoup解析表
- 23. 解析HTML數據到python列表中進行操作
- 24. Beautifulsoup HTML表格解析 - 只能得到最後一行?
- 25. 用BeautifulSoup解析HTML表格數據到字典
- 26. 解析HTML中的Python BeautifulSoup錯誤
- 27. 使用beautifulsoup解析python中的html
- 28. 將HTML表解析爲Python列表?
- 29. Beautifulsoup在Python中不完整的表格解析
- 30. 在Python中使用BeautifulSoup解析HTML
爲什麼你不能使用BeautifulSoup? – Blender 2012-03-03 20:02:22
你有什麼試過(顯示一些代碼)?什麼不起作用(給出一個示例輸入,你期望什麼作爲輸出,你會得到什麼)? – jfs 2012-03-03 20:06:52