0
我有80,000個XML文件,它們應該使用相同的格式。但是,情況顯然不是這樣。因此,我試圖識別文件中的所有現有節點和子節點。確定列表中所有可能的父母和孩子
我已經使用XML包將XML文件導入爲列表,並在下面描述了我的輸入和我所需的輸出。
輸入(名單列表):
XML1 <- list(name = "Company Number 1",
adress = list(street = "JP Street", number = "12"),
product = "chicken")
XML2 <- list(name = "Company Number 2",
company_adress = list(street = "House Street", number = "93"),
invoice = list(quantity = "2", product = "phone"))
XML3 <- list(company_name = "Company Number 3",
adress = list(street = "Lake Street", number = "1"),
invoice = list(quantity = "2", product = "phone", list(note = "Phones are refurbished")))
輸出(樹形結構跨文件與出現的次數在葉子):
List of 5
$ name : num 2
$ company_name : num 1
$ adress :List of 2
..$ street: num 2
..$ number: num 2
$ company_adress:List of 2
..$ street: num 1
..$ number: num 1
$ invoice :List of 3
..$ quantity: num 2
..$ product : num 2
..$ :List of 1
.. ..$ note: num 1
$ product : num 1
是否有一個包,可以沿着這條線做一些事情,還是我需要寫一個自己做這個的函數?