2013-01-18 99 views
0

我有幾百個XML文件。它們可能是從Excel生成的。我想將它讀入R或轉換爲CSV。所有文件的標題看起來像這樣:如何將Excel XML文件讀取/轉換爲R/CSV?

<?xml version="1.0" encoding="UTF-8"?> 
<?mso-application progid="Excel.Sheet"?> 
<Workbook xmlns="urn:schemas-microsoft-com:office:spreadsheet" 
xmlns:o="urn:schemas-microsoft-com:office:office" 
xmlns:x="urn:schemas-microsoft-com:office:excel" 
xmlns:ss="urn:schemas-microsoft-com:office:spreadsheet" 
xmlns:html="http://www.w3.org/TR/REC-html40"> 
<DocumentProperties xmlns="urn:schemas-microsoft-com:office:office"> 

我總是可以編寫解析器,但想避免這樣做。我沒有Excel

+2

'gnumeric' [package](http://cran.r-project.org/web/packages/gnumeric/index.html)可能會幫助你。 – vaettchen

回答

2

在從Excel電子表格讀取數據時,「R數據導入/導出」手冊(隨R安裝的免費手冊之一)中有一章。如果上述XML文件是最近版本的Excel中保存的電子表格,那麼其中一些工具應該可以輕鬆讀取它們。我可能會從RODBC軟件包或XLConnect軟件包開始。

如果這些不起作用,那麼XML包至少應該使解析器的寫入更容易。