我想寫一個使用beautifulsoup的python scrapper。我成功地提取了大部分數據,但我現在面臨的是價格提取中的編碼問題。如何更正用beautifulsoup報廢的數據的編碼?
這是我的例子:
的實際文本是1599€99
報廢的文字是:
>>>prdt.find("span",{"class":"price"}).text
u'1599\u20ac99'
「\ u20ac」 應該是使用 '€' 符號然而,UTF-8編碼:
>>>prdt.find("span",{"class":"price"}).text.encode(encoding='UTF-8')
'1599\xe2\x82\xac99'
有誰知道如何解決這個問題?
謝謝。