1
我希望將Endnote的xml輸出轉換爲R數據框,每個子節點都有一個單獨的列。將endnote XML轉換爲R數據框
一個類似的問題先前被要求here,但答案並沒有解決多個作者,關鍵字等記錄問題(儘管問題已被記錄)。
我想知道如何爲諸如貢獻者,期刊,關鍵字等字段添加分隔符(例如;),這些字段通常會返回多個值。
示例數據如下。可以看出,上述字段的條目有多個條目沒有添加分隔符。
library(XML)
library(RCurl)
urldata<-"https://gist.githubusercontent.com/nickbond/4f5a600836bf43a60d99e2a63e5a62de/raw/2088f8065eebbfe9e57c761ffa801b0a18588498/endnote.xml"
endnotexml<-xmlParse(getURL(urldata))
xmlToDataFrame(getNodeSet(endnotexml,'//*/record'))
我嘗試了一系列方法 - 包括嘗試首先轉換爲列表,並通過for-loop迭代條目。後者對於我的案件數量來說太慢了。任何援助非常感謝。
非常感謝克里斯。這與所描述的一樣工作,並且根據需要添加額外的節點/列是一個簡單的過程。非常感謝!! – nickb