0
我期待在使用PyQt的刮支持JavaScript的網站,之後所有的靜態HTML涉足替代品(beautifulsoup,機械化等)是否有一個簡單的類/庫,它使用pyQT/webkit來抓取JavaScript支持的網站?
顯然PyQt的是一個更通用的工具,因此不能優化我的需求。
是否有任何類/庫,它給我使用pyQT相對簡單的抓取任務的簡單功能?
我發現了幾個類/腳本通過搜索谷歌,但希望有更好的東西適合我的需要!
我需要提交表單,維護會話,並返回用lxml進行處理的html。
謝謝:)
這並不能回答你的問題,但我使用ruby的watir(瀏覽器自動化,適用於多種瀏覽器和操作系統),以滿足我的網頁抓取需求。對於幾乎所有其他的東西,我使用python。 – 2010-11-15 18:16:02