我發現HTML Agility Pack有用和易於使用的屏幕抓取網站。什麼是在Java,Ruby,Python中用於HTML屏幕抓取的等效庫?用於Java,Ruby,Python的HTML Agility Pack或HTML Screen Scraping庫?
2
A
回答
5
找到了我一直在尋找: Options for HTML scraping?
3
BeautifulSoup是標準的Python屏幕抓取工具。
但是,最近我使用了(目前不完整)pyQuery,這或多或少是將jQuery重寫爲python,並發現它非常有用。
相關問題
- 1. Html Agility Pack c#
- 2. Html Agility Pack Dll
- 3. Html Agility Pack Xpath
- 4. Screen Scraping
- 5. Html Agility Pack Foreach Reverse
- 6. Html Agility Pack xpath IEnumerable
- 7. Html Agility PacK vs Sharp Query?
- 8. Html Agility Pack DocumentNode.SelectNodes返回null
- 9. Mono for Android Html Agility Pack
- 10. Html Agility Pack空值從表
- 11. Html Agility Pack xPath問題
- 12. Html Agility Pack對於Nodecollection返回Null
- 13. HTML Agility Pack HtmlDocument顯示全部Html?
- 14. 使用Html Agility Pack抓取H3的InnerText
- 15. Html Agility Pack結束 - 不起作用
- 16. 無法使用Html Agility Pack獲得XPATH
- 17. 使用Html Agility Pack提取表格
- 18. 我可以使用Html Agility Pack嗎?
- 19. Html Agility Pack,節點中的SelectNodes
- 20. HTML Agility pack創建新的HTMLNode
- 21. Html Agility Pack返回無效的XPath
- 22. HTML/JAVA Scraping
- 23. 使用Html Agility Pack查找並移除指定的HTML標記
- 24. 使用Html Agility Pack獲取html頁面上的所有divs id
- 25. 如何使用HTML Agility Pack修復格式不正確的HTML?
- 26. Html Agility Pack:查找註釋節點
- 27. Html Agility Pack加載方法問題
- 28. HTML Agility Pack - 獲取頁面摘要
- 29. Html Agility Pack鏈接和img src提取
- 30. Html Agility Pack - 循環遍歷行和列
LXML也不錯。 – 2009-06-30 04:40:45