我擁有的將解析網站的部分代碼不起作用。urllib2不會讀取整個頁面
我可以將問題追溯到我的urllib2.urlopen對象的.read
函數。
page = urllib2.urlopen('http://magiccards.info/us/en.html')
data = page.read()
直到昨天,這工作得很好;但現在數據的長度始終是69496而不是122989,但是當我打開較小的頁面時,我的代碼工作正常。
我已經在Ubuntu,Linux Mint和Windows 7上測試過了。所有的行爲都一樣。
我假設在網絡服務器上發生了變化;但是當我使用網絡瀏覽器時該頁面已完成。我試圖用wireshark診斷這個問題,但是收到的頁面是完整的。
有人知道爲什麼會發生這種情況,或者我可以嘗試確定問題嗎?
如果你認爲這與Web服務器做,你怎麼可以做任何事情 –
這是我在py3k的urllib得到錯誤:?'HTTP。 client.IncompleteRead:IncompleteRead(69496 bytes read,53493 more expected)' – SilentGhost
因爲Web瀏覽器仍然能夠顯示完整的頁面,我的代碼也需要能夠處理整個頁面 – kannerke