好的,下面是dealio:我正在開發一個Ruby應用程序,它將從網站獲取數據並將這些數據聚合到一個XML文件中。使用Ruby腳本通過https登錄到網站
我需要從中獲取數據的網站沒有任何我可以使用的API,因此我唯一能想到的就是登錄到網站,按順序加載具有我需要的數據的頁面(在這種情況下,PMs;我想歸檔它們),然後解析返回的HTML。
但問題是我不知道任何編程模擬登錄會話的方法。
任何人都不會有任何建議,或知道我可以用來成功登錄到https頁面的任何已證實的方法,然後使用來自登錄名的臨時cookie會話以編程方式從網站加載頁面嗎?它不必是一個純Ruby解決方案 - 我只是想知道我該如何做到這一點。如果它有幫助,那麼這個網站就是使用Microsoft的.NET Passport服務作爲其登錄/會話機制的網站。
歡迎就此事提供任何意見和建議。謝謝。
我只是用這個來解決我一直面臨着很長一段時間的問題。謝謝! – seaneshbaugh 2011-10-16 09:55:31
太好了!我無法遵循該鏈接,但是這裏還有其他基本用法示例:https://github.com/sparklemotion/mechanize/tree/master/examples – 2014-06-25 00:28:02
如何解決某些網站無法在沒有javascritp的情況下登錄的問題,機械化不支持JavaScript。 – 2016-04-29 07:24:01