2010-12-14 209 views

回答

3
import urllib 
print urllib.urlopen('http://www.example.com/blah').read() 
+0

有些網站使用壓縮,當他們這樣做時會失敗。我花了很長時間才弄清楚,但是解決方法真的很難看。我會發布,如果我找到它。 +1 – Blender 2010-12-14 04:36:57

+0

那些違反http規範的網站。除非發送適當的接受編碼,否則不應返回壓縮數據。 – 2010-12-14 04:41:02

0

獲取它(使用mechanizeurllib或其他任何你想要的),解析你(使用elementtreeBeautifulSouplxml或其他任何你想要的)東西,你有你想要的。