我試圖自動下載小組研究的收入動態文件可用this web page使用R.單擊任何這些文件需要用戶通過到this login/authentication page。認證之後,使用您的網絡瀏覽器輕鬆下載文件。不幸的是,下面的代碼httr
似乎並沒有維持認證。我曾嘗試在Chrome瀏覽器中檢查Headers
Login.aspx頁面(as described here),但即使我相信我傳遞了所有正確的值,它也不會維護身份驗證。我不在乎它是否與httr
或RCurl
或RCurl
或其他內容完成,我只是喜歡R內部工作,所以我不需要這個腳本的用戶必須手動下載文件或使用一些完全獨立的程序。我的一個嘗試是在下面,但它不起作用。任何幫助,將不勝感激。謝謝!! :d如何登錄,然後從aspx網頁下載文件與R
require(httr)
values <-
list(
"ctl00$ContentPlaceHolder3$Login1$UserName" = "[email protected]" ,
"ctl00$ContentPlaceHolder3$Login1$Password" = "somepassword" ,
"ctl00$ContentPlaceHolder3$Login1$LoginButton" = "Log In" ,
"_LASTFOCUS" = "" ,
"_EVENTTARGET" = "" ,
"_EVENTARGUMENT" = ""
)
POST("http://simba.isr.umich.edu/u/Login.aspx?redir=http%3a%2f%2fsimba.isr.umich.edu%2fZips%2fZipMain.aspx" , body = values)
resp <- GET("http://simba.isr.umich.edu/Zips/GetFile.aspx" , query = list(file = "1053"))
您必須在認證後保存cookie,並在每次進一步調用時都將其傳遞 - 請參閱http://stackoverflow.com/a/15451157/564164 – daroczig 2013-04-08 22:02:54
@daroczig謝謝..我實際上試圖複製那一個昨天,它沒有工作。 :(可能還有其他的事情發生了嗎? – 2013-04-09 01:21:07