2016-03-23 102 views
0

我從google.com抓取特定的URL,但我得到了一些錯誤Python的UTF8「編解碼器不能在72位解碼字節0xc3:無效延續字節

'utf8' codec can't decode byte 0xc3 in position 72: invalid continuation byte 

代碼:

import re 
import os 
import MySQLdb 
import codecs 
import requests 
import base64 
import random 
import gzip 
import time 
from multiprocessing.pool import Pool 
import datetime 
import time 

import sys 
reload(sys) 
sys.setdefaultencoding('utf-8') 
def proxy_mesh(): 
    while True: 
     try: 

      data = requests.get('google.com') 

      print data.text.encode('utf-8') 
     except Exception, e: 
      print e 
      print "Trying again" 
      time.sleep(3) 
proxy_mesh() 

什麼是FIX以及如何超過這個錯誤?

+0

換句話說,你正在使用'UTF-8'解碼而編碼是不同的做法。 – Leb

+0

熱點解決它? @Leb – Mounarajan

+0

你可以給回溯?這可能隱含在幾個地方。 – ShadowRanger

回答

0

保持簡單,它的工作原理。數據已被requests模塊解碼。

import requests 
data = requests.get('https://www.whoisxmlapi.com/whoisserver/WhoisService?domainName=http://N%E2%94%[email protected]&outputFormat=json') 
print data.text 

由於它是一個JSON響應,您可能還需要對其進行處理:

import json 
print json.loads(data.text) 
相關問題