我正在編寫一個腳本,可以確定一個頁面是否被壓縮,並且我一直在做一些研究,並且不知道如何確定一個頁面是否被壓縮。我假設一個壓縮的頁面會在頭文件中有東西說它是一個壓縮文件。像內容類型或其他東西。有沒有辦法確定頁面是否被壓縮?
任何幫助表示讚賞。
我正在編寫一個腳本,可以確定一個頁面是否被壓縮,並且我一直在做一些研究,並且不知道如何確定一個頁面是否被壓縮。我假設一個壓縮的頁面會在頭文件中有東西說它是一個壓縮文件。像內容類型或其他東西。有沒有辦法確定頁面是否被壓縮?
任何幫助表示讚賞。
壓縮頁面將具有壓縮算法的Content-Encoding頭。
例如:
內容編碼:gzip
它實際上Content-encoding
。根據壓縮的類型,在壓縮數據的情況下,這可能是gzip
(或x-gzip
),deflate
或compress
。
的「內容編碼」/「的Accept-Encoding」 和 「傳輸編碼」,在HTTP/「TE」 頁眉/ 1.1允許客戶選擇地接收壓縮的HTTP響應, (不太常見)發送壓縮請求。 HTTP/1.1規範(RFC 2616)規定了三種壓縮方法:「gzip」(RFC 1952;包裹在gzip流中的內容),「deflate」(RFC 1950;包裹在zlib格式流中的內容)和「compress」(在RFC 2616第3.5節中解釋爲「由通用UNIX文件壓縮程序產生的編碼格式」compress),這種格式是自適應的Lempel-Ziv-Welch編碼(LZW)。許多客戶端庫,瀏覽器和服務器平臺(包括Apache和Microsoft IIS)都支持gzip。
不要用gzip的接受HTTP請求,然後分析接收的頭,並查找內容編碼:gzip
這是網絡瀏覽器,可以看到頁面是否被壓縮。作爲一個Web服務器Apache,在HTTP請求標頭中找到Accept-Encoding: gzip,deflate
。如果它存在,它將壓縮PHP腳本的HTML響應並進行相應的壓縮。
奇我想這個網址我使用的是儘管他們發誓它沒有壓縮頁面。這讓我瘋狂!大聲笑感謝您的迴應,我想我會去與服務器的人談談。 – Daniel 2010-07-28 20:22:10
除非客戶說它可以處理它(例如'Accept-Encoding:gzip'),否則服務器不會發送壓縮響應。它是HTTP內容協商過程的一部分。這可能是你的問題嗎? – hobbs 2010-07-28 20:33:03