1
當我請求一個頁面從一個URL,我得到一個不同的大小響應體比,我是通過去登錄代理服務器。例如,當url ='http://www.yahoo.com'時,響應正文大小爲〜215k,而squid代理服務器正在記錄〜43k。機甲頁大小大於報告的魷魚服務器
url = 'http://www.yahoo.com'
@webMech = Mechanize.new
@webMech.read_timeout = 60
@webMech.max_history = 10
@webMech.set_proxy(@proxyHost, @proxyHostPort, @userName, @password)
@webMech.user_agent='Mac Safari'
@webMech.agent.robots = true
puts @webMech.get(url).body.length
我想知道是否有人有我可以研究的任何解釋。提前致謝!
這可能是有和沒有壓縮。 – pguardiario
感謝您的幫助。這是否意味着一些網站發回頁面壓縮?我問,因爲我檢查與l((相同的代理服務器和設置)相同的網址和魷魚報告的大小爲〜215K。 –
某些站點發送gzip響應正文,但僅當請求在Accept-Encoding標頭中具有gzip或deflate時才發送。機械化確實發送它,l may可能不會。 – pguardiario