我在使Python正確處理我的unicode文本時遇到了一些問題。Python寫入unicode字符錯誤
我煮它歸結爲以下幾點:
>>>print 'Høst'
Høst
>>>print u'Høst'
HÃ,st
>>>u = u'Høst'
>>>u
u'H\xf8st'
sys.stdout.encoding說,這是使用UTF-8,這是最有可能的原因,第一,非Unicode,版畫作品。如果我只是需要打印一些東西,那麼這將是很好的。但是,我正在構建一個XML文檔,從SQL Server中的數據,然後它真的需要是真正的Unicode。
我的數據看起來像它的非常好的Unicode數據,u'H \ xf8st」看我的權利,那麼爲什麼Python中保持輸出爲‘哈,ST’?
或者您的終端設置不正確。 – 2011-03-10 12:13:57
至少解決了我的打印問題。現在我可以尋找類似的東西來修復我的xml生成代碼。 – Simon 2011-03-10 12:23:11
你有什麼問題與xml代?只需將您的unicode文本編碼爲正確的編碼即可。 – 2011-03-10 12:48:04