我想從我訂閱的網站提取一些數據。我可以手動提取csv文件,但每天都有一個文件,我需要5年的數據,因此需要很長時間。從網站中提取.csv文件
我已經使用rvest登錄網站,但下載我需要手動點擊一個按鈕的數據,我怎麼能在R內做到這一點?
當我手動執行該文件進入我的下載文件夾,這是完全正常的,因爲我可以做一個海量導入,但同樣如果我可以直接將數據加載到R,會更容易一些。
這是我到目前爲止有:
library(rvest)
url <-"http://www.horseracebase.com/index.php/"
pgsession <-html_session(url) ## create session
pgform <-html_form(pgsession)[[1]] ## pull form from session
filled_form <- set_values(pgform,
`login` = "xxx",
`password` = "yyy")
submit_form(pgsession,filled_form)
這讓我登錄(我認爲),但現在我不知道如何提取數據?
我做同樣的事情必發在這裏我使用類似:
df <- read.csv("http://www.someurl.com/betfairdata.csv")
這工作得很好,但他們所有的文件都實際頁,因此無需按鍵的點擊列出。
有沒有什麼方法可以使用rvest與按鈕進行交互,或者有找到正確的URL的方法,所以我可以像上面那樣使用read.csv
?
謝謝
@ Floo0我試過沒有成功,我無法獲得任何示例工作。 – MidnightDataGeek