我有一個包含這樣的數據的XML:從XML屬性中的R到data.frame
<?xml version="1.0" encoding="utf-8"?>
<posts>
<row Id="1" PostTypeId="1"
AcceptedAnswerId="15" CreationDate="2010-07-19T19:12:12.510" Score="27"
ViewCount="1647" Body="some text;" OwnerUserId="8"
LastActivityDate="2010-09-15T21:08:26.077"
Title="title" AnswerCount="5" CommentCount="1" FavoriteCount="17" />
[...]
(該數據集是dump from stats.stackexchange.com)
如何獲得與屬性的data.frame 「Id」和「PostTypeId」?
我一直在試圖與XML庫,但我得到一個地步,我不知道該如何解開值:
library(XML)
xml <- xmlTreeParse("Posts.xml",useInternalNode=TRUE)
types <- getNodeSet(xml, '//row/@PostTypeId')
> types[1]
[[1]]
PostTypeId
"1"
attr(,"class")
[1] "XMLAttributeValue"
這將是得到這些的投影中適當的R方式從XML中將兩列變成一個data.frame?
當我下載文件時,它沒有縫到xml ......什麼是編碼? – Rentrop
@ Floo0這是一個[7-zip](http://www.7-zip.org/)存檔。 – hrbrmstr