1
我需要從網頁上獲取一些數據。我試圖使用R軟件提取。在R中刮信息
原因的信息是在幾個頁面,首先我寫這篇文章的代碼:
require(XML)
contador<-c(1:200)
for(i in contador){
myURL<-paste("http://www.europa-mop.com/excavadoras-usadas/2-1/anuncios-excavadoras.html?p=",i,sep="")
}
其次,我閱讀下面的代碼的web_url:
web_url<-getURL(myURL)
web_url<-readLines(tc<-textConnection(web_url));close(tc)
webtree<-htmlTreeParse(web_url,error=function(...){})
body<-webtree$children$html$children$body
body
然而,當我執行以下命令我獲得一個錯誤:
precio<-xpathSApply(body,"//li[@class='label label-secondary text-bold']",xmlValue)
Input is not proper UTF-8, indicate encoding !
Bytes: 0xC2 0x3C 0x2F 0x64
Sequence ']]>' not allowed in content
Sequence ']]>' not allowed in content
internal error: detected an error in element content
我試過不同的選擇,但我不'無法取消這些信息。
Tx您的意見!