2012-04-04 52 views
0

檢索鏈接如何從這些節點獲取鏈接:提前任何提示從XmlNodeList中

script <- getURL("www.r-bloggers.com") 
doc <- htmlParse(script) 
li <- getNodeSet(doc, "//ul[@class='xoxo blogroll']") 

感謝。

回答

3

您可以提取a元素並在其上調用xmlGetAttr

library(RCurl) 
library(XML) 
script <- getURL("www.r-bloggers.com") 
doc <- htmlParse(script) 
li <- getNodeSet(doc, "//ul[@class='xoxo blogroll']//a") 
sapply(li, xmlGetAttr, "href") 

您也可以直接使用xpathApply

xpathSApply(doc, 
    "//ul[@class='xoxo blogroll']//a", 
    xmlGetAttr, "href" 
) 
+0

千恩萬謝,又來了! – Kay 2012-04-05 06:23:18