2014-10-27 50 views
0

我想從LendingClub下載安全數據(一家P2P貸款公司,如果您對自己的工作感興趣,請將其通過Google進行下載)。如何驗證自己在R中下載數據?

受保護的數據只能下載,如果你有一個帳戶。所以現在我有一個usernamepassword,我檢查下載頁面複製文件下載鏈接。那麼我如何驗證自己下載數據呢?我試過如下:

file <- 'lc1' 
url <- "https://www.lendingclub.com/fileDownload.action?type=gen&file=LoanStats3a_securev1.csv.zip" 
download.file(url, file) 

但它拋出警告:

trying URL 'https://www.lendingclub.com/fileDownload.action?type=gen&file=LoanStats3a_securev1.csv.zip' 
Content type 'text/html;charset=UTF-8' length 200 bytes 
opened URL 
downloaded 14 Kb 

Warning message: 
In download.file(url, file) : 
    downloaded length 14531 != reported length 200 

而且下載的文本文件不是zip文件我想要的,我想這是因爲沒有認證步驟參與,因爲如果你沒有一個帳戶,您也可以下載部分數據和鏈接不同的是:

url <- "https://resources.lendingclub.com/LoanStats3a.csv.zip" 

和以前的命令將正常工作。那麼我可以在哪裏添加認證步驟?

回答

1

您必須使用他們的REST API以及他們爲您提供的API密鑰here

然後,您可以使用您希望使用的格式(或可以在您的代碼中使用的格式)構建要下載的資源的URL。

您可以使用curl仔細檢查您的網址:

$curl -v -H "Authorization: <api key>" -XGET https://api.lendingclub.com/api/investor/v1/accounts/<investor_id>/summary 
+0

感謝您的回答,我只有一個借款人賬戶了,但我仍然可以驗證自己的瀏覽器,點擊下載受保護的文件鏈接。我是否必須獲得API的投資者帳戶才能在R中自動下載它? – user3684014 2014-10-28 13:58:37

+0

據我所知,沒有任何藉口可以通過API獲得 – 2014-10-29 22:06:59