2013-05-06 32 views
1

我對R相當陌生,以前從未使用它來編寫Web查詢。我想知道是否有任何預先存在的軟件包可以滿足我的需求。我正在嘗試搜索一家公司並返回其網站的網址。我有公司名稱,地址和電話號碼。有沒有辦法運行一個程序,檢查網站的信息,我必須確認它是正確的網站?使用R來執行網絡查詢並返回URL的

謝謝。

盧克

+0

看一看'RCurl',這可能是一個很好的爲您選擇。 – 2013-05-06 20:01:45

+1

而'httr':https://github.com/hadley/httr。它在RCurl上提供了一個更加用戶友好的包裝。 – hadley 2013-05-07 12:42:16

回答

4

不能保證,這將工作每一次,但絕對使用RCurl

library(RCurl) 
geturlname <- function(name){ 
    h = getCurlHandle() 
    z <- getURL(paste0("http://google.com/search?btnI=1&q=",name), # google i'm feeling lucky 
     followlocation=TRUE, curl=h) 
    getCurlInfo(h)$effective.url # catch the url redirect 
} 
geturlname("Apple") 
geturlname("Google") 
geturlname("Blockbuster") 
+0

我真的很喜歡這樣捕獲可能巨大的重定向。 – MVWyck 2016-06-16 15:26:16

4

托馬斯功能是有點更容易寫HTTR,因爲它:

  • 自動爲您處理句柄

  • 自動跟隨重定向

  • 返回表示請求

這裏的結果對象的功能:

library(httr) 
geturlname <- function(name){ 
    url <- paste0("http://google.com/search?btnI=1&q=", name) 
    GET(url)$url 
} 
geturlname("Apple") 
geturlname("Google") 
geturlname("Blockbuster")