2014-09-24 30 views
0

問題:當我發送網頁的GET請求時,輸出已損壞。Python套接字垃圾回覆

GET http://www.vox.com/a/maps-explain-the-middle-east HTTP/1.1\r\nHost: www.vox.com\r\nUser-Agent: Mozilla/5.0 (Windows NT 6.2; WOW64; rv:31.0) Gecko/20100101 Firefox/31.0\r\nAccept: */*\r\nAccept-Language: en-US,en;q=0.5\r\nAccept-Encoding: gzip, deflate\r\nConnection: keep-alive\r\n\r\n 

輸出是包含數據的壞文件像

���v�������/�:@�J�|d[��Xt��tF(�p3E%������?�Λ�'��\k��E�7�q����"�®}_sϵ�܏ӛv'�,,ƣ'�=���� K{O>K����l�&�A:ϳ���rѯ��U�4X,f��������_k?=�}9����p��%��d�M���g�Y�([��q��\K�B&)��fdz 

但是,當我送

GET http://www.vox.com/a/maps-explain-the-middle-east HTTP/1.1\r\nHost: www.vox.com\r\n\r\n 

我的網頁。我實際上只添加了一些從Firefox中獲取的額外頭文件。在這兩種情況下 響應頭

HTTP/1.0 200 OK

服務器:nginx

的Content-Type:text/html的;字符集= UTF-8

狀態:200 OK

X-UA-兼容:IE =邊沿,鉻= 1

緩存控制:最大年齡= 0,私人的,必須-重新驗證

X - 請求-ID:f5e482e1dd57f613df9c1b416a65b9b2

X-運行時間:0.039694

P3P:CP =「CAO DSP COR庫拉索ADMA DEVA PSAA PSDA CONI OUR IND PHY ONL UNI COM NAV INT CNT STA」

內容編碼:gzip

接受-範圍:字節

日期:星期三,2014年9月24日10:39:19 GMT

年齡:0

X-曾任-者:緩存iad2129-IAD,緩存lax1430-LAX

X-緩存:MISS,MISS

X-緩存點擊率:0,0

X-計時器:S1411555159.330146,VS0,VE108

各不相同:從本地主機

X MISS:接受編碼

X-緩存-cache-查找:MISS從本地主機:3128

途經:1.1清漆V4,1.1清漆,1.1清漆,1.0本地主機(魷魚/ 3.1.19)

連接:關閉

我不明白爲什麼會發生這是一種壓縮。

編輯:但是,如果我使用壓縮如何恢復原始數據?

回答

0

是的,我認爲這可能是由於使用的編碼方案。

因爲如果我不使用'Accept-Encoding:gzip,deflate'我會得到正確的網頁。

但我不知道如何從這個編碼中恢復網頁