我試圖通過一個XML文件進行迭代(UTF-8編碼,始於)與LXML,但得到的字符丂以下錯誤:LXML編碼錯誤
UnicodeEncodeError:「CP932 '編解碼器無法在位置0編碼字符u'\ u4e02':非法多字節序列
在此之前的其他字符被正確打印出來。 的代碼是:
parser = etree.XMLParser(encoding='utf-8')
tree = etree.parse("filename.xml", parser)
root = tree.getroot()
for elem in root:
print elem[0].text
是否錯誤意味着它不解析爲UTF-8,但在移動JIS不是文件?
哦所以這只是stdouts編碼,我沒有意識到!我只是爲了測試而使用它,畢竟我沒有問題:D 謝謝! – usagidon