2014-01-23 65 views
1

我試圖使用Hadoop做一些樣本數據分析,所以我找到了一些XML數據,如如何將XML數據轉換成CSV格式

<root> 
    <title>Document Title</title> 
    <content>Some document content.</content> 
    <keywords>test, document, keyword</keywords> 
</root> 

我怎麼能轉換成CSV這即

文檔標題,有些文檔內容,測試,文檔,關鍵詞

+0

一個簡單的方法是讀取XML,獲取節點值並將其轉換爲CSV。試試看,如果你面對任何代碼問題,請檢查一下。 –

+0

或者你可以谷歌...有大量的免費工具可用:) –

+0

可能的重複[XML到CSV使用XSLT](http://stackoverflow.com/questions/365312/xml-to-csv-using-xslt ) – Louis

回答

0

發現了一個XML轉換樣式表

樣式表有可能會有所幫助:

<xsl:stylesheet version="1.0" 
<xmlns:xsl="http://www.w3.org/1999/XSL/Transform"> 
<xsl:output method="text" encoding="iso-8859-1"/> 

<xsl:strip-space elements="*" /> 

<xsl:template match="/*/child::*"> 
<xsl:for-each select="child::*"> 
<xsl:if test="position() != last()">"<xsl:value-of select="normalize-space(.)"/>",     </xsl:if> 
<xsl:if test="position() = last()">"<xsl:value-of select="normalize-space(.)"/>"  <xsl:text>&#xD;</xsl:text> 
</xsl:if> 
</xsl:for-each> 
</xsl:template> 

</xsl:stylesheet> 

也許您想刪除xsl:if標記內的引號,以便它不會將值放入引號中,具體取決於您要使用CSV文件的位置。

相關問題