我正在研究一個研究項目,並被分配到做一些數據抓取和編寫R中的代碼,可以幫助從某個站點提取當前溫度,例如wunderground .COM。現在,這可能有點抽象的問題,但沒有人知道如何做到以下幾點:R中的天氣數據抓取和提取
temps <- readLines("http://www.wunderground.com/q/zmw:20904.1.99999")
edit(temps)
temps //gives me the source code for the website where I can look at the line that contains the temperature
ldata <- temps[lnumber]
ldata
# then have a few gsub functions that basically extracts
# just the numerical data (57.8 for example) from that line of code
我有一個包含CVS文件: 我可以這樣提取的特定郵政編碼當前溫度我在國內的每個城市的郵政編碼和我在R中輸入的郵政編碼。根據郵政編碼,城市和州情況安排在一張桌子上。我現在面臨的挑戰是編寫一個方法(在這裏使用java的比喻,因爲我是R的新手),它基本上提取6-7個連續的郵政編碼(在特定的郵政編碼之後),並通過修改readLines函數中的鏈接來運行上述代碼並在鏈接段zmw:XXXXX
之後放入相應的郵政編碼,然後根據該鏈接運行所有內容。現在我不太清楚如何從表中提取數據。也許有一個for循環功能?但後來我不知道如何使用它來修改鏈接。我認爲這是我真正陷入困境的地方。我有一些Java背景,所以我理解如何解決這個問題,而不是語法知識。我知道這是一個相當抽象的問題,因爲我沒有提供很多代碼,但我只想知道它們的函數/語法,它們將幫助我從表中提取數據,並以某種方式使用它來通過函數修改鏈接比手動做它。
請注意,您的註釋字符('/ ** /','//')在僅使用'#'的R中無效。 –
@AlexA。是啊。我的錯。我處於Java模式! –
這個問題的範圍可以縮小。這個詞拼寫應該從標題中消失,它應該是「從地下天氣中獲取天氣數據」。在正文中,你可以說你願意檢索歷史數據或者可能會刪除它。你可以提到你想從10個郵編位置開始。代碼可以保留,但它需要全部有效。您可以擺脫Java背景聲明,它們不是真正相關的。 –