2013-05-31 22 views
0

我是R和XPath的初學者, 我試圖在CRAN中抓取對象以瞭解陡峭的工作原理。獲取R和XPath單元格表的文本

我想在得到從包依賴性http://cran.r-project.org/web/packages/XML/index.html

的元素是 「bitops,RCurl」

XPath的應該是一個/html/body/table/tbody/tr[4]/td[2]

,這是我的R代碼裏面

urlContent <- htmlParse("http://cran.r-project.org/web/packages/abc/index.html") 
xpathSApply(doc=urlContent,path="/html/body/table/tbody/tr[4]/td[2]") 

但我不明白問題在哪裏,你能幫助我嗎?

+0

我用「// tr [4]/td [2]」解決了問題 – ntrax

回答

1

另一個智能選項是使用readHTMLTable並避免寫xpath

這裏我正在讀第一個表格,而不是訪問第一列等於Suggests:的那一行。

library(XML) 
dat <- readHTMLTable('http://cran.r-project.org/web/packages/XML/index.html')[[1]] 
dat[dat[,1] == "Suggests:",] 
Version:  3.96-1.1 
3 Suggests: bitops, RCurl