我想從Indeed.com的工作板上的公司名單和工作表。R - Web Scrape的工作板
我使用使用http://www.indeed.com/jobs?q=proprietary+trader&
install.packages("gtools")
install.packages('rvest")
library(rvest)
library(gtools)
mydata = read.csv("setup.csv", header=TRUE)
url_base <- "http://www.indeed.com/jobs?q=proprietary+trader&"
names <- mydata$Page
results<-data.frame()
for (name in names){
url <-paste0(url_base,name)
title.results <- url %>%
html() %>%
html_nodes(".jobtitle") %>%
html_text()
company.results <- url %>%
html() %>%
html_nodes(".company") %>%
html_text()
results <- smartbind(company.results, title.results)
results3<-data.frame(company=company.results, title=title.results)
}
new <- results(Company=company, Title=title)
一個URL基地rvest包,然後循環一個contatenation。出於某種原因,它並沒有抓住所有的工作,混合公司和工作。
我認爲例子將有助於研究這個問題。所以請添加一個工作和一個非工作示例 – Marged
您可以請發佈一個代碼工作的名稱樣本? – Metrics