我用LXML解析某些網頁如下:爲什麼它打印u'Waldenstr \ xf6m」而不是‘瓦爾登斯特’這裏UnicodeEncodeError在MySQL插入在Python
>>> doc = lxml.html.fromstring(htmldata)
>>> element in doc.cssselect(sometag)[0]
>>> text = element.text_content()
>>> print text
u'Waldenstr\xf6m'
?
在那之後,我想這個文本添加到一個MySQL表使用UTF-8字符集和utf8_general_ci collatio,用戶是一個Django模型:
>>> Users.objects.create(last_name=text)
'ascii' codec can't encode character u'\xf6' in position 9: ordinal not in range(128)
我在做什麼錯在這裏?我如何獲得正確的數據「Waldenström」並將其寫入數據庫?
是的,我試過,但它也給了同樣的錯誤。 – jack 2009-11-14 00:55:51
好吧,它現在有效。謝謝藝術。 – jack 2009-11-14 01:02:10