0
我想加載一個網站/網址,但我不需要圖像。當我使用CURL時,如何從加載中排除圖像如何在使用CURL時禁用加載圖像?
我想加載一個網站/網址,但我不需要圖像。當我使用CURL時,如何從加載中排除圖像如何在使用CURL時禁用加載圖像?
像curl <url>
這樣的調用結果僅爲純HTML頁面,並且不會加載圖像。但是,如果您想從下載的HTML中移除img標籤,則可以使用xmlstarlet的簡單XSLT。
這是XSLT(一個例子,我發現在http://www.usingxml.com/Transforms/XslIdentity的變化):
<?xml version="1.0" encoding="UTF-8"?>
<xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
version="1.0">
<!-- Remove img tag -->
<xsl:template match="img" />
<!-- IdentityTransform -->
<xsl:template match="/ | @* | node()">
<xsl:copy>
<xsl:apply-templates select="@* | node()" />
</xsl:copy>
</xsl:template>
</xsl:stylesheet>
然後調用xmlstarlet與--html
選項:
curl <url> | xmlstarlet tr --html delimg.xslt > output.html