2015-07-02 144 views
2

我正在嘗試生成一個腳本,用於從下載圖標下載該鏈接集的第一個鏈接文件here「克利夫蘭聯儲對通脹預期的估計」。從更改的URL下載Excel文件

我知道如何獲取帶有永久URL的文件,但在這種情況下,文件將定期更新,並且URL和文件名稱經常更改。

解決此問題的最佳方法是什麼?

+1

這不一定是R問題。我只會使用另一種腳本語言,以更好地支持網頁抓取(例如,Python + BeautifulSoup或PyQuery)。 –

+2

@alexpmil你可能想仔細檢查你的事實。 R擅長網頁抓取。 'httr','rvest','xml2','XML' – hrbrmstr

+2

@hrbrmstr偉大的知道。情況並非總是如此。我想最好的答案是「使用你最喜歡的網頁拼寫語言」。 –

回答

1

不是我的地區,但我建議你建立一個API或類似的東西,開始,看看here,herehere

您需要從F(R)ED獲得key。不確定克里夫蘭人是否有這樣的事情,但聖路易斯肯定是does

看看quantmod,它可以從CRAN作爲package獲得,另一個選項是FredR,您需要從Github獲得該選項。

+0

謝謝。我正在使用quantmod。在一個相關的說明,你能幫我一個忙,並檢查這是否會爲你工作。它一直在給我一個錯誤,昨天工作得很好。 (library(quantmod) getSymbols(「GDPC1」,src =「FRED」)' – Wolf

+2

'download.file(paste(FRED.URL,「/」,Symbols [[i]],「/」,「downloaddata /「,:: 無法打開網址'http:// research.stlouisfed.org/fred2/ series/GDPC1/downloaddata/GDPC1.csv''(但是當我粘貼到瀏覽器時,該URL工作正常) – hrbrmstr

+0

相同。可能會改變一些東西...... – Wolf