對不起,關於最後一篇文章。使用XSLT在html中選擇特定標記並將標記的內容打印到XML
現在我試着更加清楚。
我需要從一個HTML選擇一些標籤和我有以下XSLT
<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
<xsl:output omit-xml-declaration="yes" indent="yes"/>
<xsl:strip-space elements="*"/>
<xsl:template match="node()|@*">
<xsl:copy>
<xsl:apply-templates select="node()|@*"/>
</xsl:copy>
</xsl:template>
<xsl:template match="a"><xsl:apply-templates/></xsl:template>
<xsl:template match="img"/>
</xsl:stylesheet>
這根據我的理解選擇從一個HTML網頁/文件<a>
和<img>
標籤和打印標籤裏面的內容(告訴我,如果我的理解是錯誤的)。但上面的XSLT輸出一個頁面的整個html。任何人都可以指出我哪裏可能出錯,需要做些什麼才能使它正確。
謝謝。
除非是HTML已知的一個非常具體的形式,不能使用對HTML XSLT作爲XHTML。如果沒有,則沒有XML解析器會處理它。您可以調查JSoup,它可以從HTML生成XML DOM。 –