我正在寫一個簡單的python程序,它從網站中檢索信息,問題是有一些詞包含特殊字符,如 「°」,「Ψ」等等。Python 2.7.13 UnicodeEncodeError和特殊字符
這裏是我的代碼:
# -*- coding: utf-8 -*-
from bs4 import BeautifulSoup
import urllib
r = urllib.urlopen('http://www.samplepage.sample').read()
soup = BeautifulSoup(r, "lxml")
text = soup.find_all("a", class_="some_class")
for word in text:
word = word.get_text()
word = word.encode('utf-8')
print word
輸出應該是「度」,但不是說,我得到「A°」
,如果我嘗試用ASCII編碼是我得到的古典UnicodeEncodeError:
for word in text:
word = word.get_text()
word = word.encode('ascii')
print word
>>> UnicodeEncodeError: 'ascii' codec can't encode characters in position 7-8:
ordinal not in range(128)
任何想法?
什麼是這裏的_samplepage.sample_? – ksai
這只是任何網頁 – devmon
我們不能看到你的腳本的輸出,直到你提供_url_ – ksai