此處的免責聲明:我真的不是程序員。我渴望學習,但是我的經驗在20年前的c64和幾天的Python學習中非常基礎。在屏幕抓取時處理javascript重頁的選項
我剛剛開始一個相當大的(對於我來說,作爲一個初學者)屏幕抓取項目。到目前爲止,我一直在使用python和mechanize + lxml進行瀏覽/解析。現在我遇到了一些真正的JavaScript重載頁面,沒有顯示任何沒有啓用JavaScript的任何內容,這意味着機械化的麻煩。
從我搜索我種來,我有一個基本的幾個選項的結論:
試圖找出什麼JavaScript是這樣做在我的代碼(我不模仿一個牛逼很知道從哪裏開始與此有關。;-))
使用pywin32控制Internet Explorer或類似的東西,喜歡用從PyQt4的WebKit的瀏覽器,甚至使用telnet和mozrepl(這似乎真的很難)
Sw發癢的語言perl自www ::機械化似乎是每個(插件和這樣的JavaScript)更成熟。對此完全不瞭解太多。
如果有人在這裏有一些指針,那將是偉大的。我知道我需要做大量的試驗和錯誤,但是如果有這樣的事情,我不會離「真實」的答案太遠。
你一般想解決什麼問題? – Daenyth 2010-10-14 00:56:08
我需要將表中存儲的數據(通常不總是)存儲到數據庫中。 – user475168 2010-10-14 05:09:31