有很多網絡蜘蛛,但他們只是趕上HTML格式的互聯網。我想要一個網絡蜘蛛,捕捉動態網頁的一些方法或想法,並且可以執行javascript,並且我可以從dom樹中獲取信息。一個網絡蜘蛛,捕捉動態網頁的一些方法或想法?
0
A
回答
0
你越想讓你的蜘蛛表現得像一個真正的瀏覽器,你就需要一個真正的瀏覽器;所以,我建議從Crowbar這樣的無頭瀏覽器開始。從它的描述:
[Crowbar的]的目的是允許運行JavaScript刮板的DOM自動化網站抓取,但避免所有的語法規範化問題。
0
如果你熟悉Java,你可以嘗試以HTTP單位http://httpunit.sourceforge.net/ HttpUnit的非常直觀,易於使用。它是爲Web應用程序單元測試而設計的,但它可以成爲非常強大的網絡爬蟲工具。它已經集成了JavaScript的引擎。它還捆綁了許多有用的庫。
相關問題
- 1. asp.net(網絡蜘蛛)
- 2. 建議想:網絡蜘蛛用Perl
- 3. 阻止網絡蜘蛛
- 4. 蜘蛛不爬行網頁
- 5. 在使用scrapy製作的網絡爬蟲中調用另一個蜘蛛的一個蜘蛛
- 6. Nutch網絡蜘蛛,索引整個網絡
- 7. 使用vb.net的網絡爬蟲/蜘蛛
- 8. 網絡蜘蛛需要的幫助
- 9. 想法從一個網頁
- 10. 有人可以建議一個網絡蜘蛛嗎?
- 11. 當建立一個網絡蜘蛛,你應該使用遞歸?
- 12. Highchart蜘蛛網絡圖,pointPlacement和tickInterval
- 13. Python網絡蜘蛛:如何解決captcha?
- 14. 製作網絡爬蟲/蜘蛛
- 15. 從蜘蛛(Scrapy)無法獲取網址
- 16. 無法捕捉網絡文件更改
- 17. 試圖想出一種方法來寫一個網絡cms
- 18. 最佳網站蜘蛛?
- 19. Highchart蜘蛛網圖表
- 20. 減慢蜘蛛網址
- 21. 蜘蛛網圖Ruby on Rails
- 22. 如何繪製蜘蛛網
- 23. 使用Gluon Connect時捕捉網絡錯誤的方法
- 24. 從另一個蜘蛛的Scrapy導入方法
- 25. 網絡攝像頭捕捉
- 26. HTML解析器...我最近的項目需要一個網絡蜘蛛
- 27. 捕捉截圖並自動上傳的一些方法?
- 28. 爲幾個網站使用一個Scrapy蜘蛛
- 29. Scrapy管理動態蜘蛛
- 30. 網絡方法調用動態綁定
你的問題不是很清楚。請嘗試清楚您的問題或問題。另外,運行快速拼寫檢查可能是一個好主意(例如,「動態」?) – 2011-03-01 07:15:17