2011-04-27 94 views
0
<html> 
<head> 
<title>My Headline</title> 
<meta name="targetUrl" value="xyz.html?sym=abc"/> 
<meta name="summary" value="A & B"/> 
</head> 
<body> 
abc abc, pqr, xyz, rst tsd, prrrr, qqqqqqq, oooooo, opop opop, rtrttrt rtrtrtrt 
</body> 
</html> 

body標籤應改爲轉換爲與HTML的meta標籤CSV以CSV所以輸出應該是這樣的:需要幫助下面的HTML

ABC ABC,PQR,XYZ,首先TSD,prrrr ,qqqqqqq,OOOOOO,opop opop,rtrttrt rtrtrtrt

,如果我嘗試@吉姆的解決方案

發生

解析例外meta標籤,因爲他們有特殊字符

+0

這不是一個格式良好的XML文檔。在XSLT處理之前,您需要使用一些HTML分析器來構建一個能夠成爲XSLT處理器輸入的DOM實例。根據你的環境,這可能是一個重複的問題。 – 2011-04-28 22:31:22

回答

0

下面是一個XSLT1解決方案

<xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform" version="1.0"> 
    <xsl:output method="text"/> 
    <xsl:template match="@*|node()"><xsl:apply-templates select="@*|node()"/></xsl:template> 
    <xsl:template match="body"><xsl:value-of select="text()"/></xsl:template> 
</xsl:stylesheet> 

注意,因爲你的輸入包含前一個換行符和數據後,它會被寫入到輸出好,結果是第一條和最後一條空白。

+0

它可能更短:' \t \t ' – 2011-04-27 18:18:53

+0

感謝Jim的回答,非常感謝。 – SMG 2011-04-27 20:20:15

+0

我有在html中的特殊字符的元標記,我想通過使用上面的xsl @Jim忽略,@Alejandro是否有可能跳過元標記,如果我能得到一個示例xsl實現這一點,將不勝感激。 – SMG 2011-04-28 16:11:57