我想編寫一個python腳本,它將要求reddit發佈url,轉到頁面,使用指定的帳戶登錄,並提出帖子和註銷。可以httplib(python)與頁面及其javascript相互作用嗎?
A)這可以用python來完成嗎?
B)我該怎麼做?如果你能提供很棒的代碼,但不要自殺。
我想編寫一個python腳本,它將要求reddit發佈url,轉到頁面,使用指定的帳戶登錄,並提出帖子和註銷。可以httplib(python)與頁面及其javascript相互作用嗎?
A)這可以用python來完成嗎?
B)我該怎麼做?如果你能提供很棒的代碼,但不要自殺。
你真的需要與JavaScript交互嗎?
您可以通過查看AJAX請求逆向工程reddit的代碼使用螢火蟲或其他任何調試,檢查餅乾,請求參數等
在這之後,你可以模擬通過設置相同的請求類型這就要求使用Python的urllib的製作(GET與POST),請求參數和cookie。
還要檢查這個帖子web-scraping-with-python
除了@馬克西姆的上述偉大的建議,你也可以使用像Selenium瀏覽器測試工具(有Python綁定)來編寫一個腳本來直接與reddit的頁面交互。缺點是它會在每次運行時打開瀏覽器的副本,我不確定這是否會對您造成影響。
如果你走這條路,我*高*建議分裂:http://splinter.cobrateam.info/ – 2012-04-24 00:37:37
感謝邁克提到分裂。我已經使用硒,風車(http://www.getwindmill.com/),這也看起來很有希望。 – 2012-04-24 01:54:45
除此之外,您可以使用greasemonkey將自定義JavaScript注入到網頁中 - https://addons.mozilla.org/en-US/firefox/addon/greasemonkey/ Selenium是JavaScript的主要測試工具,與GreaseMonkey相比,Selenium的開銷更大 – 2012-04-24 01:57:50