我想從xml中獲取正常文本,其中一個字段包含html數據。我無法在template.pls中添加條件向我推薦任何解決方案。從xml使用xslt剝離html標記
<?xml version="1.0" encoding="UTF-8"?>
<workdetail>
<field name="summaryText1"><UL style="MARGIN-TOP: 0in" type=disc>
<LI style="TEXT-ALIGN: justify;MARGIN-BOTTOM: 0pt" class=MsoNormal><SPAN style="mso-fareast-font-family: 'timesnewroman'; mso-bidi-font-family: calibri; mso-bidi-theme-font: minor-latin; mso-bidi-font-style: italic"><FONT size=2>Manage the daily activities of the HOD s office.<?xml:namespace prefix = o /><o:p></o:p></FONT></SPAN></LI>
<LI style="MARGIN-BOTTOM: 0pt" class=MsoNormal><SPAN style="mso-fareast-font-family: 'timesnewroman'; mso-bidi-font-family: calibri; mso-bidi-theme-font: minor-latin; mso-bidi-font-style: italic"><FONT size=2>Handle and manage all communication, correspondence and filing of documents. <o:p></o:p></FONT></SPAN></LI>
<LI style="MARGIN-BOTTOM: 0pt" class=MsoNormal><SPAN style="mso-fareast-font-family: 'timesnewroman'; mso-bidi-font-family: calibri; mso-bidi-theme-font: minor-latin; mso-bidi-font-style: italic"><FONT size=2>Fix appointments, arrange for meetings, conferences etc.<o:p></o:p></FONT></SPAN></LI>
</workdetail>
畝XSL文件是
<xsl:stylesheet version="2.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
<xsl:output indent="yes" encoding="utf-8"/>
<xsl:strip-space elements="*"/>
<xsl:template match="/">
<workdetail>
<xsl:apply-templates select="*" />
</workdetail>
</xsl:template>
<xsl:template match="*:workdetail">
<xsl:variable name="text" select="*:field[starts-with(@name,'summaryText1')]"/>
<xsl:choose>
<xsl:when test="contains($text, '<')">
<xsl:value-of select="substring-after($text, '<')"/>
<xsl:variable name="text" select="substring-after($text, '>')"/>
</xsl:when>
<xsl:otherwise>
<xsl:value-of select="$text"/>
</xsl:otherwise>
</xsl:choose>
</xsl:stylesheet>
這之後>標籤返回的一切。我可以傳遞更多的價值在這將只返回文本文件。
請考慮發佈要爲您發佈的XML輸入示例創建的輸出。並且請告訴我們您使用的是哪個XSLT 2.0處理器,例如某些Saxon 9.5版本的http://www.saxonica.com/documentation/index.html#!functions/saxon/parse-html,這可以使解析任務HTML容易。 –
感謝martin for reply.i使用xslt2.0處理器和saxon9pe.jar進行轉換。我的期望輸出是<?xml version =「1.0」encoding =「UTF-8」?> 管理HOD辦公室的日常活動,處理和管理所有文件的通信,通信和歸檔。 ,修復約會,安排會議,會議等 summaryText1> 我只是想刪除所有html標記 –
user1906222