2013-12-23 99 views
2

我在chess.com上玩,我想下載我的遊戲的歷史。不幸的是,它們並不容易:我可以一次訪問100個50頁的遊戲,點擊「全選」和「下載」,然後通過電子郵件發送給我。自動化網絡任務?

有沒有辦法用python或其他語言編寫腳本,這可以幫助我自動化過程的任何部分?模擬點擊鏈接的東西?在單元測試之外,水豚對此類事情有用嗎?硒?

我還沒有太多的web開發經驗。謝謝你的幫助!

回答

1

你可能想看看CasperJS。我使用Python來觸發CasperJS腳本來做網頁抓取並將數據返回到Python以進一步解析或存儲到數據庫等等。

Python本身具有BeautifulSoup和Mechanize,但與基於Ajax的網站的組合並不太好。

Python和CasperJS是完美的。

+1

所以,如果我看的網站是不是基於AJAX的,BeautifulSoup可能是理想解? – bluemihai

+1

是的,我會說如果你不想抓取由JavaScript操縱的動態數據,那麼beautifulsoup會更快。 –

0

如果你想要這樣做,硒可能是一個很好的候選人。

這裏是一些僞代碼:

foreach page_link in page_links: 
    page_link.click() 
    select_all.click() 
    download_link.click() 
0

Helium看看。它應該是比較容易實現了用戶在使用Python庫做什麼:

start_chrome("chess.com") 
... 
click("Select All") 
click("Download") 
...