2010-10-02 37 views

回答

2

curl <url>這樣的調用結果僅爲純HTML頁面,並且不會加載圖像。但是,如果您想從下載的HTML中移除img標籤,則可以使用xmlstarlet的簡單XSLT。

這是XSLT(一個例子,我發現在http://www.usingxml.com/Transforms/XslIdentity的變化)​​:

<?xml version="1.0" encoding="UTF-8"?> 
<xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform" 
version="1.0"> 

    <!-- Remove img tag --> 
    <xsl:template match="img" /> 

    <!-- IdentityTransform --> 
    <xsl:template match="/ | @* | node()"> 
    <xsl:copy> 
     <xsl:apply-templates select="@* | node()" /> 
    </xsl:copy> 
    </xsl:template> 

</xsl:stylesheet> 

然後調用xmlstarlet與--html選項:

curl <url> | xmlstarlet tr --html delimg.xslt > output.html 
相關問題