1
我試圖導入一個XML文件與一組響應到R.這是一個link to a version with dummy data顯示該文件的結構。xml到與正確的列名稱的數據框
我已經試過與XML
包纏鬥成數據幀此如下:
library(XML)
file <- "test.xml"
data <- xmlParse(file)
xml_data <- xmlToList(data)
df <- data.frame(matrix(unlist(xml_data), nrow=1, byrow=T))
這給了我482列。
接下來我嘗試提取列名失敗。
n <- NULL
for (i in 1:length(xml_data)) {
if (length(xml_data[[i]])==1) {
n <- c(n, names(xml_data[i]))
}
if (length(xml_data[[i]])>1) {
n <- c(n, names(xml_data[[i]]))
}
}
這隻給出了長度爲290的矢量,所以我簡短了一堆列名。
關於我要去哪裏的任何想法都是錯誤的?
這是有幫助的。名稱並不完全正確,因爲它們包含'something.varname'和'something.something.varname'。我只需要在上一段時間後保持一切。 –
'sub('。* \\。','',names(unlist(xml_data)))''接近,除了我有一些像'varname.1'這樣的變量名,它會被剪切爲'1 '等 –
請參閱上面的修改。 – Dave2e