我想刮一個網站,但它給了我一個錯誤。UnicodeEncodeError:'charmap'編解碼器無法編碼字符
我用下面的代碼:
import urllib.request
from bs4 import BeautifulSoup
get = urllib.request.urlopen("https://www.website.com/")
html = get.read()
soup = BeautifulSoup(html)
print(soup)
而且我發現了以下錯誤:
File "C:\Python34\lib\encodings\cp1252.py", line 19, in encode
return codecs.charmap_encode(input,self.errors,encoding_table)[0]
UnicodeEncodeError: 'charmap' codec can't encode characters in position 70924-70950: character maps to <undefined>
我能做些什麼來解決這個問題?
請勿在您的腳本中硬編碼您的環境的字符編碼(例如,控制檯),[直接打印Unicode](http://stackoverflow.com/a/32176732/4279) – jfs 2015-09-07 04:09:59
這只是打印repr一個'bytes'對象,如果有很多UTF-8編碼的文本,它將打印成'\ x'序列的混亂。正如@ J.F.Sebastian所建議的,我建議使用'win_unicode_console'。 – eryksun 2016-05-23 20:48:01
我使用了上面的解決方案,但sill得到了問題:class MyStreamListener(tweepy.StreamListener): def on_status(self,status): print(str(status.encode(「utf-8」))) UnicodeEncodeError:'charmap '編解碼器不能編碼字符'\ u2019'在位置87:字符映射到 –
Vivek
2016-09-26 23:49:28