1
我想寫一個for循環,將循環通過許多網站,並提取一些元素,並將結果存儲在R表中。這是我到目前爲止,只是不知道如何啓動for循環,或者將所有結果複製到一個變量中以稍後導出。循環的URL和存儲信息在R
library("dplyr")
library("rvest")
library("leaflet")
library("ggmap")
url <- c(html("http://www.webiste_name.com/")
agent <- html_nodes(url,"h1 span")
fnames<-html_nodes(url, "#offNumber_mainLocContent span")
address <- html_nodes(url,"#locStreetContent_mainLocContent")
scrape<-t(c(html_text(agent),html_text(fnames),html_text(address)))
View(scrape)
工作太棒了!我如何調整以確保每個刮片的數據存儲在單獨的行中?現在它將它們全部存儲在彼此相鄰的地方 – CHopp
我不知道我理解你的問題。在'lapply'的data.frame中,你可以使用下面的'data.frame(Agent = agent,Fnames = fnames,Address = address,URL = u)'爲每一行產生相應的url –
我想出來了,但另一個問題,爲什麼我會在嘗試搜索網站時遇到這樣的錯誤 「錯誤:'www.website.com'在當前工作目錄中不存在」 – CHopp