我在chess.com上玩,我想下載我的遊戲的歷史。不幸的是,它們並不容易:我可以一次訪問100個50頁的遊戲,點擊「全選」和「下載」,然後通過電子郵件發送給我。自動化網絡任務?
有沒有辦法用python或其他語言編寫腳本,這可以幫助我自動化過程的任何部分?模擬點擊鏈接的東西?在單元測試之外,水豚對此類事情有用嗎?硒?
我還沒有太多的web開發經驗。謝謝你的幫助!
我在chess.com上玩,我想下載我的遊戲的歷史。不幸的是,它們並不容易:我可以一次訪問100個50頁的遊戲,點擊「全選」和「下載」,然後通過電子郵件發送給我。自動化網絡任務?
有沒有辦法用python或其他語言編寫腳本,這可以幫助我自動化過程的任何部分?模擬點擊鏈接的東西?在單元測試之外,水豚對此類事情有用嗎?硒?
我還沒有太多的web開發經驗。謝謝你的幫助!
你可能想看看CasperJS。我使用Python來觸發CasperJS腳本來做網頁抓取並將數據返回到Python以進一步解析或存儲到數據庫等等。
Python本身具有BeautifulSoup和Mechanize,但與基於Ajax的網站的組合並不太好。
Python和CasperJS是完美的。
如果你想要這樣做,硒可能是一個很好的候選人。
這裏是一些僞代碼:
foreach page_link in page_links:
page_link.click()
select_all.click()
download_link.click()
在Helium看看。它應該是比較容易實現了用戶在使用Python庫做什麼:
start_chrome("chess.com")
...
click("Select All")
click("Download")
...
等
所以,如果我看的網站是不是基於AJAX的,BeautifulSoup可能是理想解? – bluemihai
是的,我會說如果你不想抓取由JavaScript操縱的動態數據,那麼beautifulsoup會更快。 –