這是我的代碼,你們也可以測試一下。我總是得到亂七八糟的字符,而不是頁面源。爲什麼我在使用urllib2打開url時弄亂了字符?
Header = {"User-Agent": "Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.9.2.8) Gecko/20100722 Firefox/3.6.8 GTB7.1 (.NET CLR 3.5.30729)"}
Req = urllib2.Request("http://rlslog.net", None, Header)
Response = urllib2.urlopen(Req)
Html = Response.read()
print Html[:1000]
通常Html
應該是網頁的源文件,但它最終要噸亂七八糟的字符。任何人都知道爲什麼?
BTW:我對蟒蛇2.7
對我來說工作正常,問題必須在別的地方。在輸出響應的方式中可能有一些簡單的錯誤? – Kapep
@kapep:你確定嗎?我只是簡單地'打印Html [:100]',他們都搞砸了。你在什麼Python版本? – Shane
這只是一個瘋狂的猜測,因爲打印部分不包括在內。按我的預期工作。使用2.6.4。 – Kapep