2012-12-15 76 views
1

我很難有效解析我從美國職業棒球大聯盟(MLB)檢索到的XML。MLB XML解析R

首先,這是一個旨在幫助我熟悉XML的副項目。我對R最熟悉,所以我覺得一旦我成功,我就有更好的機會調試代碼。

我能夠通過這些代碼來獲取XML:

xmlurl<-"http://gd2.mlb.com/components/game/mlb/year_2012/month_06/day_11/miniscoreboard.xml" 
xmltree<-xmlTreeParse(xmlurl,useInternalNodes=TRUE) 

我很想能夠在整個XML中提取信息。例如,對於今天所有的比賽,我想提取每支球隊的得分數(「away_team_runs」&「home_team_runs」)。此外,我希望能夠基本上從我希望的文檔中提取任何內容,但迄今爲止我還沒有成功完成這項工作。

任何指針將不勝感激。

回答

2

例如,使用帶xpathSApply

xpathSApply(xmltree,'//games/*',xmlGetAttr,'away_team_runs') 
[1] "6" "1" "3" "3" 
xpathSApply(xmltree,'//games/*',xmlGetAttr,'home_team_runs') 
[1] "3" "4" "0" "2"