我遇到了問題。我有一個XML文檔,我需要到R. 到目前爲止,我設法它使用包xml
和plyr
,做一個簡單的XML上傳到data.frame將xml文檔轉換爲data.frame中的R
dataframe=ldply(xmlToList("file.xml"), data.frame)
但是當一個data.frame我運行這個XML:
<BusinessUnitList>
<BusinessUnit id="000000195">
<User id="897654322" firstName="Rick" lastName="Test" middleName="R" defaultLanguageName="English">
<RoleList>
<Role id="worker"/>
</RoleList>
<OrgList>
<Organization id="1111"/>
</OrgList>
<Address country="Italy"/>
<Employee badgeNumber="575757" Date="2017-01-01" DateNew="2017-01-02" birthDate="1999-01-01">
<Availability val1="5" val2="n" val3="6" HoursPerWeek="33.75" HoursBetweenShifts="10" minHoursPerWeek="00.00"/>
</Employee>
</User>
</BusinessUnit>
<BusinessUnit id="000000111">
<User id="897652222" firstName="TERI" lastName="tst2" middleName="D" defaultLanguageName="English">
<RoleList>
<Role id="worker"/>
</RoleList>
<OrgList>
<Organization id="2222"/>
</OrgList>
<Address country="Portugal"/>
<Employee badgeNumber="575757" Date="2017-02-02" DateNew="2017-02-02" birthDate="1998-01-01">
<Availability val1="5" val2="n" val3="6" HoursPerWeek="33.75" HoursBetweenShifts="10" minHoursPerWeek="00.00"/>
</Employee>
</User>
</BusinessUnit>
</BusinessUnitList>
我收到一個錯誤:Error in (function (..., row.names = NULL, check.rows = FALSE, check.names = TRUE, : arguments imply differing number of rows: 9, 7.
請提供樣本數據和代碼。 – PhilC
爲了能夠爲您提供幫助,我們需要了解您對輸出格式有何期待(您希望在哪個列中輸入哪些信息?) – sinQueso
實際上,XML [*] [1]不太可能存在文件。您應該花一些時間來了解錯誤(至少一列沒有相同數量的條目)。您可能需要像XML文件那樣經常進行工作。 SO上有大量的XML處理問答。你似乎完全沒有做過研究。 – hrbrmstr