獲取R和XPath單元格表的文本

我是R和XPath的初學者，我試圖在CRAN中抓取對象以瞭解陡峭的工作原理。獲取R和XPath單元格表的文本

我想在得到從包依賴性http://cran.r-project.org/web/packages/XML/index.html

的元素是「bitops，RCurl」

XPath的應該是一個/html/body/table/tbody/tr[4]/td[2]

，這是我的R代碼裏面

urlContent <- htmlParse("http://cran.r-project.org/web/packages/abc/index.html") 
xpathSApply(doc=urlContent,path="/html/body/table/tbody/tr[4]/td[2]")

但我不明白問題在哪裏，你能幫助我嗎？

來源

2013-05-31 ntrax

我用「// tr [4]/td [2]」解決了問題 – ntrax

另一個智能選項是使用readHTMLTable並避免寫xpath。

這裏我正在讀第一個表格，而不是訪問第一列等於Suggests:的那一行。

library(XML) 
dat <- readHTMLTable('http://cran.r-project.org/web/packages/XML/index.html')[[1]] 
dat[dat[,1] == "Suggests:",] 
Version:  3.96-1.1 
3 Suggests: bitops, RCurl

來源

2013-05-31 11:06:00 agstudy

獲取R和XPath單元格表的文本

回答

相關問題