2012-02-09 42 views
0

我的網站上有一些文檔,用戶可以通過富文本編輯器進行編輯,然後將它們保存到數據庫並打印出來。有些用戶遇到問題(只發生在現場),其中一些角色被搞砸了。我已經檢查過數據庫,並且有趣的角色在數據庫中,所以它不是顯示問題。當他們保存文檔(在網站上提交表單),或者他們在那裏放了些奇怪的東西,或者他們的瀏覽器改變了某些字符時,它們都會發生。什麼會導致 變成unicode字符?

不斷出現的字符是 。這是一個帶有重音的A,後面跟着一個空格。查看源代碼HTML,似乎受影響的文檔已經轉換了所有 。但是每當我嘗試它時,它們都會很好。

什麼會導致 變成一個unicode字符,但只在有限的情況下?

+2

您沒有正確處理編碼。請參閱[在Webapp中處理Unicode](http://kunststube.net/frontback/)並排除您的問題。 – deceze 2012-02-10 00:02:29

回答

4

將UTF-8編碼誤解爲Latin-1將導致此錯誤。

>>> u'\xa0'.encode('utf-8').decode('latin-1') 
u'\xc2\xa0' 
>>> print u'\xa0*'.encode('utf-8').decode('latin-1') 
 * 
相關問題