XML,我有以下XML文檔:使用LXML解析與日本
<package>
<title>セレニティー (字幕版)</title>
...
</package>
我使用lxml
解析標題如下:
node = etree.fromstring(file_contents)
title = node.xpath("//t:title/text()")
title
[u' \u30bb\u30ec\u30cb\u30c6\u30a3\u30fc (\u5b57\u5e55\u7248)']
然而,當我INSERT
這爲我的數據庫使用title.encode(utf-8)
,我得到的廢話
セレニティー (å—幕版)
我該如何正確解析title
這裏(所謂的字幕版),所以我可以做一個INSERT
的值。
SET GLOBAL init_connect ='SET NAMES utf8';' – David542 2012-02-19 21:32:42