我希望getencoding的輸出在下面的Python會話是 「ISO-8859-1」:是否在urllib2中破壞了response.info()。getencoding()的實現?
>>> import urllib2
>>> response = urllib2.urlopen("http://www.google.com/")
>>> response.info().plist
['charset=ISO-8859-1']
>>> response.info().getencoding()
'7bit'
這與Python版本2.6('2.6(R26:66714,2009年8月17日,16 :01:07)\ n [特別是GCC 4.0.1(Apple Inc. build 5484)]。
我期望擁有'charset = UTF-8'。這是我在google.com上查看源代碼時得到的結果。 – 2009-08-20 22:45:08
據我所知,這種方法只會看標題,而不是頁面中的meta標籤: $ curl -I http://www.google.com/ HTTP/1.1 200 OK Date:Thu ,20 Aug 2009 22:40:54 GMT Expires:-1 Cache-Control:private,max-age = 0 Content-Type:text/html; charset = ISO-8859-1 Set-Cookie:PREF = ID = 7592ab15eefe9966:TM = 1250808054:LM = 1250808054:S = KaPYgHdNyGx7eglv;到期= 2011年8月20日星期六22:40:54 GMT;路徑= /; domain = .google.com Server:gws Transfer-Encoding:chunked – John 2009-08-20 22:50:04
好吧,我猜評論不會採用與帖子相同的格式,但您明白了。 – John 2009-08-20 22:51:22