2010-11-15 35 views
0

我期待在使用PyQt的刮支持JavaScript的網站,之後所有的靜態HTML涉足替代品(beautifulsoup,機械化等)是否有一個簡單的類/庫,它使用pyQT/webkit來抓取JavaScript支持的網站?

顯然PyQt的是一個更通用的工具,因此不能優化我的需求。

是否有任何類/庫,它給我使用pyQT相對簡單的抓取任務的簡單功能?

我發現了幾個類/腳本通過搜索谷歌,但希望有更好的東西適合我的需要!

我需要提交表單,維護會話,並返回用lxml進行處理的html。

謝謝:)

+0

這並不能回答你的問題,但我使用ruby的watir(瀏覽器自動化,適用於多種瀏覽器和操作系統),以滿足我的網頁抓取需求。對於幾乎所有其他的東西,我使用python。 – 2010-11-15 18:16:02

回答

1

你可能想看看spynner --IT是基於QtWebKit的綱領性瀏覽器模塊。它可能會滿足你的需求。

相關問題