我對R相當陌生,以前從未使用它來編寫Web查詢。我想知道是否有任何預先存在的軟件包可以滿足我的需求。我正在嘗試搜索一家公司並返回其網站的網址。我有公司名稱,地址和電話號碼。有沒有辦法運行一個程序,檢查網站的信息,我必須確認它是正確的網站?使用R來執行網絡查詢並返回URL的
謝謝。
盧克
我對R相當陌生,以前從未使用它來編寫Web查詢。我想知道是否有任何預先存在的軟件包可以滿足我的需求。我正在嘗試搜索一家公司並返回其網站的網址。我有公司名稱,地址和電話號碼。有沒有辦法運行一個程序,檢查網站的信息,我必須確認它是正確的網站?使用R來執行網絡查詢並返回URL的
謝謝。
盧克
不能保證,這將工作每一次,但絕對使用RCurl
包
library(RCurl)
geturlname <- function(name){
h = getCurlHandle()
z <- getURL(paste0("http://google.com/search?btnI=1&q=",name), # google i'm feeling lucky
followlocation=TRUE, curl=h)
getCurlInfo(h)$effective.url # catch the url redirect
}
geturlname("Apple")
geturlname("Google")
geturlname("Blockbuster")
我真的很喜歡這樣捕獲可能巨大的重定向。 – MVWyck 2016-06-16 15:26:16
托馬斯功能是有點更容易寫HTTR,因爲它:
自動爲您處理句柄
自動跟隨重定向
返回表示請求
這裏的結果對象的功能:
library(httr)
geturlname <- function(name){
url <- paste0("http://google.com/search?btnI=1&q=", name)
GET(url)$url
}
geturlname("Apple")
geturlname("Google")
geturlname("Blockbuster")
看一看'RCurl',這可能是一個很好的爲您選擇。 – 2013-05-06 20:01:45
而'httr':https://github.com/hadley/httr。它在RCurl上提供了一個更加用戶友好的包裝。 – hadley 2013-05-07 12:42:16