我一直試圖進入R,並認爲最好的方法是想出一個我喜歡的項目,並深入其中。所以我想分析我的短信習慣。我設法我的文本導出爲以下格式的XML文件:使用R解析屬性的XML
<all>
<message date="1423813836987" number="+15555555" type="1" read="1" locked="1" seen="1">content of text</message>
<message date="1423813836987" number="+15555555" type="1" read="1" locked="1" seen="1">another content of text</message>
</all>
現在,我想要做的是提取屬性「日期」和「數量」和每封郵件的內容和創建一個數據框。我的最終目標是爲每個「數字」創建一個圖表,並查看我多久發短信的次數。
環顧四周後,我發現R的XML package。我可以提取郵件的內容,但無法從單個message
標籤獲取屬性。一切,我發現關於屬性談到像嵌套的標籤:
<message>
<date>1423813836987</date>
<number>555-555</number>
</message>
會有人點我的方向是正確的?有沒有更好的方法來做這樣的事情?我到目前爲止是這樣的:
doc = xmlRoot(xmlTreeParse("~/Desktop/data.xml"))
xml_data <- xmlToList(doc)
但它使屬性看起來很時髦。
在此先感謝您。